Strumenti informatici 6.6 Modelli di analisi della varianza con più di una variabile indipendente 6.6.1 ANOVA fattoriale completamente between Nella pratica comune è raro che le ipotesi di ricerca prendano in considerazione solo una variabile indipendente. Nel caso dello studio di validazione di un test, ad esempio, di solito si indaga se il punteggio è in relazione con le variabili socio-demografiche principali, come il genere, il titolo di studio e l’età. Naturalmente è possibile verificare che il punteggio al test sia in relazione con ognuna di queste variabili mediante tre diverse e separate analisi, ma per riuscire ad avere una migliore comprensione dei fenomeni occorre utilizzare modelli statistici che tengano conto dell’effetto di tutte le possibili cause contemporaneamente, salvo poi, con opportuni test post-hoc, andare ad indagare come si comporta singolarmente ogni variabile indipendente. La logica di base di questo tipo di modelli è la stessa dell’analisi della varianza con una sola variabile indipendente (e dunque detta “ANOVA ad una via”, dall’inglese one-way, o “ANOVA ad un criterio di classificazione”): la variabilità della variabile dipendente è spiegata dall’effetto delle variabili indipendenti, singolo e congiunto, e da una quota di errore specifico. Questo, di fatto, è il vantaggio dell’utilizzare modelli lineari: poiché gli effetti sono additivi (vedi la assunzioni per l'applicazione di ANOVA nel paragrafo 6.3.1 del manuale), il considerare ulteriori variabili indipendenti fa sì che la suddivisione della “torta” che rappresenta la variabilità della variabile dipendente produca più “fette”, ognuna corrispondente all’effetto delle variabili indipendenti. In questo senso, ogni volta che aggiungiamo al modello una nuova variabile indipendente andiamo a definire in modo progressivamente più preciso il reale ruolo giocato da ognuna delle altre variabili indipendenti. Nel caso della Figura 6.6 del manuale, la variabilità della variabile dipendente (punteggio al test) era stata suddivisa in una quota spiegata dalla diversa condizione clinica dei soggetti (devianza between) e in una quota che avevamo chiamato di errore (devianza within). Ora, il termine “devianza di errore” non deve trarre in inganno, in quanto non è semplicemente la quota di variabilità della variabile dipendente spiegata da un qualche tipo di errore, ma, più correttamente, è la quota di variabilità della variabile dipendente che non è spiegata dalla variabile indipendente. Questo significa che potrebbe contenere anche l’effetto di altre variabili indipendenti che in quel momento non stiamo considerando e che invece giocano un ruolo centrale nella spiegazione del fenomeno che stiamo studiando. Quando si cerca di descrivere un fenomeno mediante un modello lineare, quindi, occorre prestare particolare attenzione a quella che è chiamata la specificazione del modello, ossia la selezione delle variabili indipendenti da inserire, perché da questa operazione dipende il successo dell’analisi. Sia chiaro che il “successo” dell’analisi non risiede, come purtroppo molti pensano, nel trovare che tutti gli effetti delle variabili indipendenti siano statisticamente significativi, ma nel riuscire a “vedere” l’impatto sulla variabile dipendente di ogni possibile variabile indipendente in modo non distorto né dall’assenza di altre variabili indipendenti importanti, né dalla presenza di variabili indipendenti irrilevanti. E’ in questo modo che si giunge ad una spiegazione soddisfacente del fenomeno in esame. Le variabili indipendenti che è possibile inserire nel modello possono essere variabili categoriali (e in questo caso prendono il nome di fattori) e/o variabili continue (e in questo caso prendono il nome di covariate). In base alla presenza e alle caratteristiche dei fattori e delle covariate è possibile realizzare tutta una serie di diversi modelli, che prendono il nome di modelli di ANOVA fattoriale (se presenti solo due o più fattori), di ANCOVA (analisi della covarianza, se presenti un fattore e una o più covariate), o di ANCOVA fattoriale (se presenti sia due o più fattori, sia covariate). I fattori, a loro volta, possono essere variabili per gruppi indipendenti (fattori between) oppure per misure ripetute o campioni dipendenti (fattori within), per cui si parlerà di Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia modelli fattoriali completamente between se tutti i fattori sono per gruppi indipendenti (ad esempio, l’effetto di genere e condizione clinica sul punteggio ad un test psicologico), di modelli fattoriali completamente within se tutti i fattori sono per misure ripetute (ad esempio, in un esperimento di psicologia dell’attenzione lo stesso gruppo di soggetti viene sottoposto a tutti i possibili incroci dei livelli di due variabili indipendenti come tempo di esposizione dello stimolo [100 msec; 500 msec] e dimensione dello stimolo [grande; media; piccola] e viene studiato l’effetto dei fattori sul tempo di reazione), e di modelli fattoriali misti se sono presenti sia fattori between, sia within (ad esempio, si considera l’effetto dell’appartenere al gruppo di controllo o al gruppo sperimentale [between] e del trascorrere del tempo [inizio dell’intervento, dopo 3 mesi, dopo 6 mesi; within] sul punteggio ad un test di funzionamento psicologico]. I modelli fattoriali vengono indicati con una notazione particolare, a moltiplicazione. Nel caso dell’indagine dell’effetto del genere e della condizione clinica sul punteggio ad un test psicologico, si parlerà quindi di ANOVA fattoriale completamente between 2 × 4: il numero dei fattori (che non per caso è il “soprannome” delle variabili indipendenti) della moltiplicazione indica il numero di variabili indipendenti, che in questo caso è due: la prima variabile indipendente ha 2 livelli (genere: Maschi; Femmine), la seconda 4 livelli (condizione clinica: Guariti; Migliorati; Invariati; Peggiorati). Nel caso dell’effetto sul tempo di reazione del tempo di esposizione e della dimensione dello stimolo si parlerà di ANOVA fattoriale completamente within 2 × 3 (due livelli del tempo di esposizione dello stimolo e tre per la dimensione dello stimolo). Nel caso dell’effetto dell’appartenere al gruppo di controllo o al gruppo sperimentale [between] e del trascorrere del tempo [inizio, 3 mesi, 6 mesi; within] sul punteggio ad un test di funzionamento psicologico si parlerà di ANOVA fattoriale mista 2 × 3, dove 2 sono i livelli della variabile between (gruppo sperimentale o di controllo) e 3 quelli della variabile within (tempo della rilevazione: inizio dell’intervento, dopo 3 mesi, dopo 6 mesi). Quando la variabili dipendenti sono più di una, per cui viene studiato l’effetto delle variabili indipendenti sull’insieme delle variabili dipendenti, con successivi test post-hoc per la valutazione dell’effetto delle variabili indipendenti su ogni singola variabile dipendente, si parla di ANOVA multivariata (MANOVA), con le stesse possibili varianti dell’ANOVA univariata (una sola variabile dipendente) in base alla presenza di più fattori e/o covariate (MANOVA fattoriale completamente between, MANOVA fattoriale completamente within, MANOVA mista, MANCOVA [analisi multivariata della covarianza], etc.) In teoria non c’è un limite al numero di variabili indipendenti che possiamo aggiungere ad un modello lineare: quanto più complesso è il fenomeno, tanto maggiore sarà il numero di variabili indipendenti che dovremo utilizzare per ottenerne una spiegazione adeguata. Il punto, però, è che con l’aggiunta di ulteriori variabili indipendenti si moltiplicano gli effetti da considerare, in quanto ogni variabile indipendente non contribuirà solo singolarmente, ma anche in interazione con le altre. Un effetto di interazione si verifica quando l’effetto di una variabile indipendente sulla variabile dipendente dipende o è condizionato dal valore di un’altra variabile indipendente, detta moderatore. Supponiamo di stare studiando l’effetto del tipo di psicoterapia (individuale o di gruppo) sul numero di sintomi ossessivi osservabili al termine della terapia, e al tempo stesso considerare il possibile effetto moderatore dell’ostilità interpersonale. La Figura 6.6.1 mostra un possibile esito dell’analisi dei dati. Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia Numero medio di sintomi Individuale Gruppo Ostilità Bassa Ostilità Alta Punteggio Ostilità Figura 6.6.1 Grafico delle medie per quattro gruppi di pazienti: con bassa ostilità in psicoterapia individuale, con alta ostilità in psicoterapia individuale, con bassa ostilità in psicoterapia di gruppo, con alta ostilità in psicoterapia di gruppo. Dal grafico in Figura 6.6.1 osserviamo che il numero medio di sintomi è di fatto identico in tre gruppi di soggetti: con bassa ostilità in psicoterapia individuale, con alta ostilità in psicoterapia individuale, con bassa ostilità in psicoterapia di gruppo, mentre per il quarto gruppo (con alta ostilità in psicoterapia di gruppo) il numero medio di sintomi è maggiore. Questo significa che quando andiamo a porci la domanda “la psicoterapia individuale e quella di gruppo sono ugualmente efficaci nel ridurre il numero di sintomi ossessivi?” non possiamo rispondere né di sì, né di no, perché la risposta che verrebbe naturale dare in questo caso è “Dipende”. Dipende da cosa? Dal livello di ostilità interpersonale: se il livello è basso, le due psicoterapie funzionano in modo simile, mentre se il livello è alto, la psicoterapia individuale funziona meglio di quella di gruppo. In questo senso, l’ostilità interpersonale modera l’effetto del tipo di psicoterapia. Possiamo quindi definire un moderatore come una variabile qualitativa (e.g., genere, etnia, classe sociale) o quantitativa (e.g., livello di ansia di tratto) che influenza la direzione e/o la forza della relazione fra una variabile indipendente e una dipendente. L’effetto moderatore di una variabile indipendente su un’altra variabile indipendente (detta focale) viene evidenziato statisticamente mediante l’effetto di interazione. Quando andiamo a rappresentare quali sono le componenti additive che producono il punteggio osservato y nella variabile dipendente dobbiamo quindi scrivere: y = µ + α + β + αβ + ε dove µ è il punteggio che ci aspettiamo di osservare nella popolazione in assenza di tutti gli altri effetti (e che quindi è uguale per tutti i soggetti), α è l’effetto principale della prima variabile indipendente, β è l’effetto principale della seconda variabile indipendente, αβ è l’effetto di interazione delle due variabili considerare, ε è l’errore specifico, ossia l’effetto di tutte le altre cause non inserite nel modello. Se le variabili indipendenti fossero tre (α, β, γ), dovremmo considerare, oltre agli effetti principali, anche tutte le possibili interazioni, che a questo punto sono di secondo ordine (αβ, αγ, βγ) e di terzo ordine (αβγ). Se le variabili indipendenti fossero quattro (α, β, γ, λ) dovremmo considerare tutti gli effetti di secondo ordine (αβ, αγ, αλ, βγ, βλ, γλ), tutti quelli di terzo (αβγ, αβλ, αγλ, βγλ), e quello di quarto (αβγλ), etc. La moltiplicazione degli effetti di interazione che si verifica aggiungendo variabili indipendenti però, costituisce uno dei limiti dei modelli lineari, almeno a livello di spiegazione dei risultati. Lo scopo della ricerca non è tanto quello di arrivare a spiegare il 100% della variabilità della variabile dipendente, quanto quello di comprendere le cause di un fenomeno. Nel caso dell’effetto del tipo di psicoterapia e del livello di ostilità, abbiamo spiegato l’effetto di interazione come un intervento moderatore del livello di ostilità sull’effetto del tipo di psicoterapia: questa spiegazione, però, è basata su argomenti puramente teorici, perché il Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia risultato statistico è perfettamente compatibile anche con una spiegazione in cui i ruoli di variabile focale e moderatore siano invertiti, ossia che il tipo di psicoterapia modera l’effetto del livello di ostilità interpersonale: non dimentichiamo che la statistica è cieca alla teoria, e in casi come questi non ci dice quale variabile sia quella focale e quale moderatore: è la nostra conoscenza del fenomeno che ci porta ad assegnare questi “ruoli”. Quando le variabili indipendenti sono più di due e risulta significativo l’effetto di interazione di ordine più alto, la spiegazione diventa più complessa. Supponiamo che oltre a tipo di psicoterapia e livello di ostilità sia stato considerato come variabile indipendente il genere. Come possiamo interpretare un effetto di interazione di terzo ordine significativo? L’interazione genere per tipo di psicoterapia modera l’effetto dell’ostilità? Il genere modera l’effetto interattivo di tipo del psicoterapia con l’ostilità? Non è facile, a meno di una approfondita conoscenza del fenomeno in esame, uscire dal labirinto di possibili spiegazioni, anche perché non basta spiegare perché è valida quella che proponiamo noi: dobbiamo anche spiegare perché le altre interpretazioni compatibili coi risultati sono meno valide. Immaginatevi quindi il livello di complessità della spiegazione dell’effetto di interazione di ordine superiore se inserite nel modello quattro, cinque o più variabili indipendenti. La Figura 6.6.2 mostra le “fette” di variabilità della variabile dipendente che spettano ad ogni effetto delle variabili indipendenti. Figura 6.6.2 Suddivisione della devianza della variabile dipendente in base agli effetti delle variabili indipendenti Dal punto di vista della verifica delle ipotesi sul piano statistico, la logica rimane la stessa dell’analisi della varianza ad una via: ogni devianza viene divisa per i rispettivi gradi di libertà, si ottengono le varianze, e si eseguono i F di confronto fra la varianza attribuibile ad un particolare effetto e la varianza di errore. In questo senso, quindi, andiamo a considerare più di una significatività statistica, dato che le ipotesi da verificare sono più di una. Nel caso dell’effetto del tipo di psicoterapia e del livello di ostilità sul numero di sintomi al termine della psicoterapia dobbiamo realizzare un’ANOVA fattoriale completamente between, dato che abbiamo due variabili indipendenti, entrambe per gruppi indipendenti. Obiettivo: verificare l’effetto del tipo di psicoterapia e del livello di ostilità sul numero di sintomi al termine della psicoterapia Variabili Variabile Indipendente 1: Tipo di psicoterapia (nominale, dicotomica: Individuale, Gruppo) Variabile Indipendente 2: Livello di ostilità (nominale, dicotomica: Bassa, Alta) Variabile Dipendente: Numero di sintomi (a rapporti) Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia Ipotesi: potrebbe esservi un effetto del tipo di psicoterapia indipendentemente dal livello di ostilità, del livello di ostilità indipendentemente dal tipo di psicoterapia, oppure un effetto di interazione tipo di psicoterapia × livello di ostilità Effetti principali H0: µGruppo = µIndividuale → indipendentemente dal livello di ostilità, la popolazione da cui è stato estratto il gruppo di pazienti in psicoterapia di gruppo al termine della psicoterapia presenta lo stesso numero di sintomi della popolazione da cui è stato estratto il gruppo di pazienti in psicoterapia individuale → non si riscontrano differenze nel numero di sintomi in base al solo effetto del tipo di psicoterapia H1: µGruppo ≠ µIndividuale → indipendentemente dal livello di ostilità, la popolazione da cui è stato estratto il gruppo di pazienti in psicoterapia di gruppo al termine della psicoterapia non presenta lo stesso numero di sintomi della popolazione da cui è stato estratto il gruppo di pazienti in psicoterapia individuale → si riscontrano differenze nel numero di sintomi in base al solo effetto del tipo di psicoterapia H0: µBassa = µAlta → indipendentemente dal tipo di psicoterapia, la popolazione da cui è stato estratto il gruppo di pazienti con bassa ostilità al termine della psicoterapia presenta lo stesso numero di sintomi della popolazione da cui è stato estratto il gruppo di pazienti con alta ostilità → non si riscontrano differenze nel numero di sintomi in base al solo effetto del livello di ostilità H1: µBassa ≠ µAlta → indipendentemente dal tipo di psicoterapia, la popolazione da cui è stato estratto il gruppo di pazienti con bassa ostilità al termine della psicoterapia non presenta lo stesso numero di sintomi della popolazione da cui è stato estratto il gruppo di pazienti con alta ostilità → si riscontrano differenze nel numero di sintomi in base al solo effetto del livello di ostilità Effetto di interazione H0: (µGruppo − µIndividuale)Bassa = (µGruppo − µAlta)Individuale oppure (µBassa − µAlta)Gruppo = (µBassa − µAlta)Individuale → nella popolazione di pazienti con bassa ostilità la differenza fra le medie delle sottopopolazioni dei pazienti in psicoterapia individuale e di gruppo è uguale alla differenza fra le medie delle sottopopolazioni dei pazienti in psicoterapia individuale e di gruppo nella popolazione di pazienti con alta ostilità → l’ostilità non modera l’effetto del tipo di psicoterapia; oppure nella popolazione di pazienti che seguono una psicoterapia individuale la differenza fra le medie delle sottopopolazioni dei pazienti con alta e bassa ostilità è uguale alla differenza fra le medie delle sottopopolazioni dei pazienti con alta e bassa ostilità nella popolazione di pazienti in psicoterapia di gruppo → il tipo di psicoterapia non modera l’effetto del livello di ostilità H1: Almeno una differenza è significativa → nella popolazione di pazienti con bassa ostilità la differenza fra le medie delle sottopopolazioni dei pazienti in psicoterapia individuale e di gruppo è diversa rispetto alla differenza fra le medie delle sottopopolazioni dei pazienti in psicoterapia individuale e di gruppo nella popolazione di pazienti con alta ostilità, oppure nella popolazione di pazienti che seguono una psicoterapia individuale la differenza fra le medie delle sottopopolazioni dei pazienti con alta e bassa ostilità è diversa rispetto alla differenza fra le medie delle sottopopolazioni dei pazienti con alta e bassa ostilità nella popolazione di pazienti in psicoterapia di gruppo − vi è un effetto di interazione fra il tipo di psicoterapia e il livello di ostilità: l’ostilità modera l’effetto del tipo di psicoterapia oppure il tipo di psicoterapia modera l’effetto del livello di ostilità Avendo i dati a disposizione, è possibile svolgere i calcoli necessari per verificare queste ipotesi anche a mano, ma data la complessità dell’operazione, si preferisce presentare direttamente le procedure per farlo in SPSS. I dati dell’esempio che viene proposto sono riportati in Tabella 6.6.1. Nel file di dati di SPSS devono essere riportati nello stesso modo della tabella. Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia Tabella 6.6.1 Dati per la realizzazione di un’ANOVA fattoriale completamente between Psicoterapia (0 = Individuale; 1 = Gruppo) 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 Ostilità (0 = Bassa; 1 = Alta) 0 0 0 0 0 1 1 1 1 1 0 0 0 0 0 1 1 1 1 1 Numero di sintomi 5 6 7 8 9 4 6 8 9 10 8 9 10 11 12 12 14 15 16 17 Per realizzare l’ANOVA fattoriale completamente between in SPSS, occorre seguire il percorso Analyze → General Linear Model → Univariate (Figura 6.6.3). Figura 6.6.3 Percorso di SPSS per la realizzazione di un’ANOVA fattoriale completamente between Nella finestra che si apre dobbiamo inserire nel campo Dependent Variable la variabile dipendente (in questo caso Numero di sintomi), e nel campo Fixed Factors i fattori (in questo caso Psicoterapia e Livello di ostilità) (Figura 6.6.4) Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia Figura 6.6.4 Impostazioni di SPSS per la realizzazione di un’ANOVA fattoriale completamente between Il software permette anche l’impiego di fattori random (vedi Rimando SPSS 6.4), di covariate (come potrebbe essere l’età, vedi la sezione 6.6.4 per un esempio) e di un “peso differenziato” (WLS weight) da attribuire ad ogni soggetto (utilizzato solo in particolari analisi dove sia possibile determinare il peso differenziale di ogni caso). Clickando su Model si apre una finestra che permette di impostare gli effetti da inserire nel modello: non siamo infatti obbligati a considerare tutti i possibili effetti delle variabili indipendenti e della loro interazione, ma potremmo scegliere, in base alla nostra conoscenza del fenomeno, di escludere alcuni effetti per non complicare inutilmente l’interpretazione dei risultati. L’impostazione di default di SPSS è di inserire nel modello tutti i possibili effetti (Full Factorial), ma spuntando l’opzione Custom è possibile, selezionando opportunamente le variabili nel campo Factors & Covariates e scegliendo il tipo di effetto (interazione [Interaction], effetti principali [Main Effects], tutte le interazioni di secondo ordine [All 2-way], tutte le interazioni di terzo ordine [All 3-way], etc.) scegliere di specificare solo alcuni di tutti i possibili effetti (Figura 6.6.5) Figura 6.6.5 Scelta degli effetti da introdurre nel modello lineare in SPSS per un’ANOVA fattoriale completamente between Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia Clickando su Contrasts si apre una finestra analoga a quella della Figura 6.5.4 del Box 6.5. Anche in questo caso il tipo di contrasti possibile è limitato da quelli disponibili nel menu a tendina del riquadro Change Constrast, anche se può essere impostato un contrasto diverso per ogni fattore. Clickando su Plots è possibile impostare la realizzazione del grafico, che nel caso di un modello fattoriale è di fondamentale importanza, in quanto dalla sola ispezione visiva del grafico delle medie è possibile stimare quali effetti, fra quelli principali e quello di interazione, sono significativi. Si può scegliere quale variabile avrà le categorie sull’asse orizzontale (Horizontal Axis) e quale avrà le diverse categorie rappresentate da linee di colore diverso sul grafico (Separate Lines) (Figura 6.6.6). Ogni impostazione deve poi essere trasferita nel campo in basso mediante un click su Add. Nel caso di un modello fattoriale a tre variabili, è possibile ottenere grafici separati in base ai livelli di una terza variabile. Se nel nostro modello avessimo avuto anche il genere, avremmo potuto richiedere al software di realizzare un grafico Psicoterapia × Ostilità per i maschi e uno per le femmine inserendo la variabile Genere nel campo Separate Plots. Figura 6.6.6 Impostazione dei grafici di ANOVA in SPSS Mentre clickando su Save si accede ad una finestra che consente di impostare le statistiche avanzate da salvare, clickando su Post-Hoc è possibile scegliere, per ogni effetto principale, il tipo di test post-hoc da realizzare. Nel caso specifico che stiamo considerando è inutile, perché le variabili hanno due sole categorie. Se l’effetto di interazione è significativo, però, significa che possiamo accettare l’ipotesi nulla formulata in precedenza, per cui può essere di interesse confrontare i livelli di una delle variabili su ciascun livello dell’altra variabile. Per far questo dobbiamo clickare su Options (Figura 6.6.7). Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia Figura 6.6.7 La finestra Options di SPSS per la realizzazione di un’ANOVA fattoriale completamente between Tutti i possibili effetti compaiono nel campo Factor(s) and Factor Interactions. Basta spostarli nel campo Display Means for: e spuntare Compare Main Effects, scegliendo poi il tipo di “aggiustamento” per controllare l’inflazione dell’errore di I tipo dovuta ai confronti multipli. Il problema, però, è che anche inserendo l’effetto di interazione nel campo Display Means for: SPSS di default realizza i confronti post-hoc solo per gli effetti principali1, e non per l’interazione (che peraltro sono quelli che di solito interessano di più). Fortunatamente, intervenendo sulla sintassi di SPSS è possibile ottenerli. Prima di procedere, nella finestra Options spuntiamo anche Descriptive Statistics, Estimates of effect size e Homogeneity tests, come in Figura 6.6.7. Una volta clickato Continue e tornati alla finestra principale, clickare su Paste. Si aprirà una nuova finestra che contiene le righe di comando di SPSS (Figura 6.6.8). Figura 6.6.8 Finestra di sintassi di SPSS Originariamente, SPSS doveva essere programmato con righe di comando, e le versioni point-andclick sono venute solo dopo. Gli utenti avanzati di SPSS lavorano molto con la sintassi, in quanto consente di impostare più analisi nello stesso programma. Le righe di comando possono essere salvate in un file di sintassi che ha l’estensione .SPS. Al momento, però, quello che ci interessa è 1 Si noti che questi test post-hoc sugli effetti principali hanno un significato analogo a quelli della finestra Post-Hoc solo quando i gruppi abbiano tutti la stessa numerosità e varianze omogenee Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia poter modificare le righe di comando per ottenere i confronti post-hoc per l’effetto di interazione. L’operazione è molto semplice: basta cambiare il testo della Figura 6.20 /EMMEANS = TABLES(Psicoterapia*Ostilita) con il testo in grassetto nella sintassi seguente: UNIANOVA Sintomi BY Psicoterapia Ostilita /METHOD = SSTYPE(3) /INTERCEPT = INCLUDE /PLOT = PROFILE( Psicoterapia*Ostilita Ostilita*Psicoterapia ) /EMMEANS = TABLES(Psicoterapia) COMPARE ADJ(BONFERRONI) /EMMEANS = TABLES(Ostilita) COMPARE ADJ(BONFERRONI) /EMMEANS = TABLES(Psicoterapia*Ostilita) COMPARE(Psicoterapia) ADJ(BONFERRONI) /EMMEANS = TABLES(Psicoterapia*Ostilita) COMPARE(Ostilita) ADJ(BONFERRONI) /PRINT = DESCRIPTIVE ETASQ /CRITERIA = ALPHA(.05) /DESIGN = Psicoterapia Ostilita Psicoterapia*Ostilita . A questo punto basta clickare sul tasto nella finestra del file di sintassi (oppure seguire il percorso Run → All) per ottenere l’output. L’output produce inizialmente tre tabelle (Between Subjects Factors, Descriptive Statistics, e Levene's Test of Equality of Error Variances, Figura 6.6.9) che riassumono il disegno della ricerca e riportano media, deviazione standard e numerosità dei gruppi in esame e, soprattutto, ci permettono di verificare se le varianze dei gruppi sono omogenee, che, come sappiamo, è un'assunzione che deve essere rispettata per l'applicazione del test statistico in oggetto. Descriptive Statistics Between-Subjects Factors Psicoterapia Livello di ostilità Value Label Individuale Gruppo Bassa Alta ,00 1,00 ,00 1,00 Dependent Variable: Numero di sintomi N 10 10 10 10 Psicoterapia Individuale Gruppo Total Livello di ostilità Bassa Alta Total Bassa Alta Total Bassa Alta Total Mean 7,0000 7,4000 7,2000 10,0000 14,8000 12,4000 8,5000 11,1000 9,8000 Std. Deviation 1,58114 2,40832 1,93218 1,58114 1,92354 3,02581 2,17307 4,40833 3,63608 N 5 5 10 5 5 10 10 10 20 a Levene's Test of Equality of Error Variances Dependent Variable: Numero di sintomi F ,623 df1 df2 3 16 Sig. ,611 Tests the null hypothesis that the error variance of the dependent variable is equal across groups. a. Design: Intercept+Psicoterapia+Ostilita+Psicoterapia * Ostilita Figura 6.6.9 Output di SPSS per un’ANOVA fattoriale completamente between La tabella Test of Between-Subjects Effects riporta invece le significatività di tutti gli effetti (Figura 6.6.10) Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia Tests of Between-Subjects Effects Dependent Variable: Numero di sintomi Source Corrected Model Intercept Psicoterapia Ostilita Psicoterapia * Ostilita Error Total Corrected Total Type III Sum of Squares 193,200a 1920,800 135,200 33,800 24,200 58,000 2172,000 251,200 df 3 1 1 1 1 16 20 19 Mean Square 64,400 1920,800 135,200 33,800 24,200 3,625 F 17,766 529,876 37,297 9,324 6,676 Sig. ,000 ,000 ,000 ,008 ,020 Partial Eta Squared ,769 ,971 ,700 ,368 ,294 a. R Squared = ,769 (Adjusted R Squared = ,726) Figura 6.6.10 Tabella di SPSS con la significatività degli effetti di un’ANOVA fattoriale completamente between In questo caso occorre ignorare le informazioni di Corrected Model e Intercept, e concentrarsi solo su Psicoterapia, Ostilita e Psicoterapia*Ostilita, che rappresentano gli effetti principali e l’interazione, rispettivamente. I valori nella colonna Sig. rappresentano le probabilità associate al fatto che i dati osservati siano il risultato di un’ipotesi nulla vera. La regola di decisione è: Se Sig. < ,05 → Rifiutiamo H0 → L'effetto è significativo Se Sig. > ,05 → Accettiamo H0 → L'effetto non è significativo I risultati in Figura 6.6.10 mostrano che possiamo rifiutare l’ipotesi nulla per tutti e tre gli effetti e dunque possiamo concludere che c’è un effetto principale del tipo di psicoterapia, un effetto principale del livello di ostilità, e un effetto di interazione tipo di psicoterapia × livello di ostilità. I tre effetti sono indipendenti fra loro, per cui è possibile che siano tutti significativi, solo alcuni significativi, nessuno significativo. Per comprendere la direzione degli effetti, di solito si può far riferimento al grafico di interazione, come mostrato in Figura 6.6.11. Figura 6.6.11 Grafico di interazione prodotto da SPSS La Figura 6.6.11 riporta i due tipi di grafico che è possibile realizzare quando i fattori in gioco sono due: nel grafico di sinistra sull’asse orizzontale ci sono i livelli del fattore ‘Tipo di Psicoterapia’ e i livelli del fattore ‘Livello di Ostilità’ sono rappresentati da linee di colore diverso, mentre nel Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia grafico di destra avviene il contrario. Il grafico di sinistra mostra come il numero medio di sintomi (qui indicato come Estimated Marginal Means, che vuol dire “stima delle medie marginali”) sia simile per i gruppi di ostilità in caso di psicoterapia individuale, ma molto diverso in caso di psicoterapia di gruppo, con un numero medio di sintomi maggiore in caso di alto livello di ostilità. Il grafico di destra, invece, mostra come in caso di psicoterapia individuale il numero di sintomi sia comunque minore rispetto al caso della psicoterapia di gruppo, all’interno della quale, ad ogni modo, vi è un numero medio di sintomi maggiore in caso di alto livello di ostilità. La lettura di un grafico di interazione avviene come rappresentato in Figura 6.6.12. Figura 6.6.12 Esempi tipici di grafici di ANOVA fattoriale con effetti principali ed effetto di interazione La Figura 6.6.13 riporta tutti i possibili casi. Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia Figura 6.6.13 Possibili esiti di un’ANOVA fattoriale completamente between (Nota: NS = non significativo) Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia Occorre prestare particolare attenzione all’interpretazione del valore di dimensione dell’effetto η2 (nella Figura 6.6.10, colonna Partial Eta Squared). Questo valore non deve essere interpretato in SS effetto base alle linee guida Tabella 6.11 del manuale, perché è calcolato come e non SS effetto + SS errore come SS effetto SS totale . Nel caso dell’effetto principale del Tipo di Psicoterapia, η2 parziale = ,700, che è il SS effetto 135,200 =,700 . Il valore di η2, invece, è dato dal rapporto fra SS effetto + SS errore 135,200 + 58,00 SSeffetto e la somma delle devianze dei tre effetti e dell’errore, ossia 123,20 + 33,80 + 24,20 + 58,00 = 251,20. Tale valore corrisponde nella Figura 6.6.10 alla devianza relativa alla voce Corrected SS effetto 135,20 Total. η 2 = = =,54 . Anche in questo caso, però, sarebbe preferibile calcolare il SS Corrected Total 251,20 SS Effetto − ( gdl effetto ) MS errore 135,20 − (1)3,63 ) ) valore di ω 2 mediante la formula ω 2 = = =,52 . Con la 251,20 + 3,63 SS Corrected Total + MS errore ) stessa operazione siamo in grado di calcolare i valori di η2 parziale, η2 e ω 2 anche per gli altri effetti. I risultati sono riportati in Tabella 6.6.2 risultato di = Tabella 6.6.2 Confronto fra gli indici di dimensione dell’effetto η parziale, η e Figura 6.6.10 2 Effetto Psicoterapia Ostilità Psicoterapia × Ostilità η2 parziale (riportato da SPSS) ,70 ,37 ,29 2 ) ω2 per gli effetti in ) η2 ω2 ,54 ,13 ,10 ,52 ,12 ,08 Occorre quindi porre estrema cautela nell’interpretare la dimensione dell’effetto offerta da SPSS. Dopo la tavola di ANOVA fattoriale con gli effetti principali, se lo si è richiesto SPSS riporta i confronti fra le medie per gli effetti principali e per l’interazione sotto la dicitura Estimated Marginal Means. Nel caso che stiamo considerando gli effetti principali non hanno bisogno di posthoc in quanto i fattori sono variabili dicotomiche, per cui se l’effetto è significativo, la differenza sarà a favore del livello del fattore con la media più alta. La Figura 6.6.14 riporta le tabelle per gli effetti principali. Tipo di Psicoterapia Estimates Dependent Variable: Numero di sintomi Psicoterapia Individuale Gruppo Mean 7,200 12,400 Std. Error ,602 ,602 95% Confidence Interval Lower Bound Upper Bound 5,924 8,476 11,124 13,676 Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia Pairwise Comparisons Dependent Variable: Numero di sintomi (I) Psicoterapia Individuale Gruppo (J) Psicoterapia Gruppo Individuale Mean Difference (I-J) -5,200* 5,200* a Std. Error ,851 ,851 Sig. ,000 ,000 95% Confidence Interval for a Difference Lower Bound Upper Bound -7,005 -3,395 3,395 7,005 Based on estimated marginal means *. The mean difference is significant at the ,05 level. a. Adjustment for multiple comparisons: Bonferroni. Livello di Ostilità Estimates Dependent Variable: Numero di sintomi Livello di ostilità Bassa Alta Mean 8,500 11,100 Std. Error ,602 ,602 95% Confidence Interval Lower Bound Upper Bound 7,224 9,776 9,824 12,376 Pairwise Comparisons Dependent Variable: Numero di sintomi (I) Livello di ostilità Bassa Alta (J) Livello di ostilità Alta Bassa Mean Difference (I-J) -2,600* 2,600* Std. Error ,851 ,851 a Sig. ,008 ,008 95% Confidence Interval for a Difference Lower Bound Upper Bound -4,405 -,795 ,795 4,405 Based on estimated marginal means *. The mean difference is significant at the ,05 level. a. Adjustment for multiple comparisons: Bonferroni. Figura 6.6.14 Estimated Marginal Means per l’effetto principale del Tipo di Psicoterapia e del Livello di Ostilità La Figura 6.6.14 mostra come il numero di sintomi sia maggiore in chi segue una psicoterapia di gruppo (indipendentemente dal livello di ostilità) e per chi ha un’alta ostilità (indipendentemente dal tipo di psicoterapia). La Figura 6.6.15 riporta invece le tabelle per i confronti sugli effetti di interazione. Si noti che i valori di probabilità riportati nelle colonne Sig. sono già corretti per confronti multipli in base alla procedura Bonferroni, per cui possono essere interpretati direttamente in base alla regola: Se Sig. < ,05 → Rifiutiamo H0 → La differenza è significativa Se Sig. > ,05 → Accettiamo H0 → La differenza non è significativa Confronti dei livelli di Tipo di Psicoterapia sui singoli livelli di Livello di Ostilità Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia Estimates Dependent Variable: Numero di sintomi Psicoterapia Individuale Gruppo Livello di ostilità Bassa Alta Bassa Alta Mean 7,000 7,400 10,000 14,800 Std. Error ,851 ,851 ,851 ,851 95% Confidence Interval Lower Bound Upper Bound 5,195 8,805 5,595 9,205 8,195 11,805 12,995 16,605 Pairwise Comparisons Dependent Variable: Numero di sintomi Livello di ostilità Bassa Alta (I) Psicoterapia Individuale Gruppo Individuale Gruppo Mean Difference (I-J) -3,000* 3,000* -7,400* 7,400* (J) Psicoterapia Gruppo Individuale Gruppo Individuale a Std. Error 1,204 1,204 1,204 1,204 Sig. ,024 ,024 ,000 ,000 95% Confidence Interval for a Difference Lower Bound Upper Bound -5,553 -,447 ,447 5,553 -9,953 -4,847 4,847 9,953 Based on estimated marginal means *. The mean difference is significant at the ,05 level. a. Adjustment for multiple comparisons: Bonferroni. Confronti dei livelli di Livello di Ostilità sui singoli livelli di Tipo di Psicoterapia Estimates Dependent Variable: Numero di sintomi Psicoterapia Individuale Gruppo Livello di ostilità Bassa Alta Bassa Alta Mean 7,000 7,400 10,000 14,800 Std. Error ,851 ,851 ,851 ,851 95% Confidence Interval Lower Bound Upper Bound 5,195 8,805 5,595 9,205 8,195 11,805 12,995 16,605 Pairwise Comparisons Dependent Variable: Numero di sintomi Psicoterapia Individuale Gruppo (I) Livello di ostilità Bassa Alta Bassa Alta (J) Livello di ostilità Alta Bassa Alta Bassa Mean Difference (I-J) Std. Error -,400 1,204 ,400 1,204 -4,800* 1,204 4,800* 1,204 a Sig. ,744 ,744 ,001 ,001 95% Confidence Interval for a Difference Lower Bound Upper Bound -2,953 2,153 -2,153 2,953 -7,353 -2,247 2,247 7,353 Based on estimated marginal means *. The mean difference is significant at the ,05 level. a. Adjustment for multiple comparisons: Bonferroni. Figura 6.6.15 Confronti post-hoc dei livelli di un fattore sui singoli livelli dell’altro fattore Nella Figura 6.6.15 i confronti dei livelli di Tipo di Psicoterapia sui singoli livelli di Livello di Ostilità mostrano come il numero medio di sintomi di chi segue una psicoterapia di gruppo sia Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia comunque maggiore di quello di chi segue una psicoterapia individuale, mentre i confronti dei livelli di Livello di Ostilità sui singoli livelli di Tipo di Psicoterapia mostrano come non ci sia differenza significativa fra le medie di Basso e Alto livello di Ostilità in caso di psicoterapia individuale, mentre vi sia una differenza significativa fra le medie dei livelli di Ostilità in caso di psicoterapia di gruppo, con alti livelli di ostilità associati ad un numero medio di sintomi maggiore2. Per riportare il risultato in un articolo scientifico o in una tesi di laurea riporteremo la tabella con le statistiche descrittive, uno dei due grafici in Figura 6.6.11 e scriveremo: E’ stata eseguita un’analisi della varianza fattoriale 2 × 2 completamente between (Tipo di Psicoterapia [Individuale, Gruppo] × Livello di Ostilità [Alto, Basso]). Sono risultati significativi entrambi gli effetti principali (Psicoterapia: F(1, 16) = 37,30, p < ,001, η2 parziale = 0,70; Livello di Ostilità: F(1, 16) = 9,32, p = ,008, η2 parziale = 0,37; Interazione: F(1, 16) = 6,77, p = ,020, η2 parziale = 0,29). Gli effetti principali erano dovuti ad un numero medio di sintomi maggiore per chi seguiva una psicoterapia di gruppo e per chi aveva un alto livello di ostilità. I confronti post-hoc sugli effetti di interazione hanno mostrato che il numero medio di sintomi di chi segue una psicoterapia di gruppo è maggiore di quello di chi segue una psicoterapia individuale indipendentemente dal livello di ostilità, mentre i confronti dei livelli di Livello di Ostilità sui singoli livelli di Tipo di Psicoterapia hanno rivelato come non ci sia differenza significativa fra le medie di Basso e Alto livello di Ostilità in caso di psicoterapia individuale, mentre vi sia una differenza significativa fra le medie dei livelli di Ostilità in caso di psicoterapia di gruppo, con alti livelli di ostilità associati ad un numero medio di sintomi maggiore. 6.6.2 ANOVA fattoriale completamente within Quando tutte le variabili indipendenti, o fattori, sono entro i soggetti, ossia rappresentano misure ripetute sugli stessi soggetti, si parla di ANOVA fattoriale completamente within. Consideriamo il caso in cui lo stesso gruppo di 20 soggetti viene sottoposto ad un serie prove in cui vengono mostrati degli oggetti di dimensioni variabili (grande, media, piccola) per un tempo di 100 o 500 msec. Il compito del soggetto è premere la barra spaziatrice quando ha riconosciuto l’oggetto e nominarlo. In questo caso i fattori sono le Dimensioni dell’Oggetto e il Tempo di Esposizione dello stimolo, mentre la variabile dipendente è il Tempo di Reazione, calcolato come media delle prove per ogni incrocio dei livelli dei fattori (o condizione). In questi casi, per ogni incrocio dei livelli dei fattori vengono somministrate molte prove (in gergo, trials), e per ognuna si ottiene un tempo di reazione. Di solito, dopo aver “ripulito” i dati da eventuali valori outliers (comuni in questo tipo di esperimenti), per ogni condizione si calcola il tempo di reazione medio (o mediano). I risultati sono riportati in Tabella 6.6.3. Tabella 6.6.3 Risultati dell’esperimento di riconoscimento di oggetti (tempo di reazione, millisecondi) Soggetto A B Esposizione 100 msec Dimensione Piccola Media Grande 2975 2725 1450 3000 3000 2700 Esposizione 500 msec Dimensione Piccola Media Grande 2350 1850 1800 3200 3925 2275 2 SPSS in questi casi riporta anche una tabella chiamata Univariate Tests che è legata all’opzione di default dei Constrasts. In questo caso non è stata riportata per non appesantire il testo. Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia C D E F G H I L M N O P Q R S T U V 3425 4825 1950 2100 6050 4250 3425 3825 3400 7250 1950 3975 2275 1900 5350 1775 1550 2600 4400 3875 1200 1850 6075 2800 4275 3525 4000 6450 1950 2425 2300 1850 5000 2450 1950 2085 3750 3775 1900 725 2075 3400 3925 2150 4250 4925 1900 2300 1675 1700 5025 2875 1775 3650 3350 4700 1375 1950 6175 4150 4225 3250 4050 6500 2050 3375 3625 1650 5775 3000 1800 2500 3500 3775 1750 1250 3550 3175 3025 2150 3550 2980 2075 2250 2050 1750 2345 1750 2050 2675 3350 2150 1750 1250 3275 3400 2350 1975 2775 3100 2300 1800 1175 2100 4050 2150 1750 3350 Obiettivo: verificare l’effetto del Tempo di Esposizione e della Dimensione dello Stimolo sul tempo di riconoscimento di un oggetto Variabili Variabile Indipendente 1: Tempo di Esposizione (nominale, dicotomica: 100 msec, 500 msec) Variabile Indipendente 2: Dimensione dello Stimolo (nominale, politomica: Piccola, Media, Grande) Variabile Dipendente: Tempo di Reazione (msec, a rapporti) Ipotesi: potrebbe esservi un effetto del Tempo di Esposizione indipendentemente dalla Dimensione dello Stimolo, della Dimensione dello Stimolo indipendentemente dal Tempo di Esposizione, oppure un effetto di interazione tipo di Tempo di Esposizione × Dimensione dello Stimolo Effetti principali H0: µ100msec = µ500msec → indipendentemente dalla dimensione dello stimolo, la popolazione a cui fanno riferimento le osservazioni per un tempo di esposizione di 100 msec ha un tempo di reazione medio uguale alla popolazione a cui fanno riferimento le osservazioni per un tempo di esposizione di 500 msec → non si riscontrano differenze nel tempo di reazione in base al tempo di esposizione dello stimolo H1: µ100msec ≠ µ500msec → indipendentemente dalla dimensione dello stimolo, la popolazione a cui fanno riferimento le osservazioni per un tempo di esposizione di 100 msec ha un tempo di reazione medio diverso dalla popolazione a cui fanno riferimento le osservazioni per un tempo di esposizione di 500 msec → si riscontrano differenze nel tempo di reazione in base al tempo di esposizione dello stimolo H0: µPiccola = µMedia = µGrande → indipendentemente dal tempo di esposizione dello stimolo, le popolazioni a cui fanno riferimento le osservazioni per le varie dimensioni dello stimolo hanno tempi di reazione medi uguali → non si riscontrano differenze nel tempo di reazione in base alla dimensione dello stimolo H1: Almeno due medie diverse → indipendentemente dal tempo di esposizione dello stimolo, le popolazioni a cui fanno riferimento le osservazioni per le varie dimensioni dello stimolo non hanno tutte tempi di reazione medi uguali → si riscontrano differenze nel tempo di reazione in Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia base alla dimensione dello stimolo, e i test post-hoc riveleranno quali condizioni sono significativamente diverse fra loro Effetto di interazione3 H0: (µ100msec − µI500msec)Piccola = (µ100msec − µI500msec)Media = (µ100msec − µI500msec)Grande → la differenza fra i tempi di reazione medi delle popolazioni a cui fanno riferimento le osservazioni per un tempo di esposizione di 100 msec e 500 msec è uguale su tutti i livelli di dimensione dello stimolo → la dimensione dello stimolo non modera l’effetto del tempo di esposizione H1: Almeno due differenze diverse → la differenza fra i tempi di reazione medi delle popolazioni a cui fanno riferimento le osservazioni per un tempo di esposizione di 100 msec e 500 msec non è uguale su tutti i livelli di dimensione dello stimolo → la dimensione dello stimolo modera l’effetto del tempo di esposizione Per realizzare l’ANOVA fattoriale completamente within in SPSS procediamo come nel caso dell’ANOVA per misure ripetute (vedi Rimando SPSS 6.5), col percorso Analyze → General Linear Model → Repeated Measures. I dati vanno organizzati come un Figura 6.6.16, che riproduce la Tabella 6.6.3. Figura 6.6.16 Organizzazione dei dati in SPSS per realizzare un’ANOVA fattoriale completamente within. Nella finestra dove vengono specificati i fattori within inseriremo Tempo (2 livelli) e Dimensio (tre livelli; SPSS non consente l’inserimento di nomi di fattori within più lunghi di 8 caratteri) (Figura 6.6.17). Il nome della variabile va inserito nel campo Within-Subject Factor Name, e in Number of Levels va specificato il numero di livelli di questo fattore. La procedura di inserimento del fattore viene completata clickata su Add. Una volta completato l'inserimento dei fattori, si passa alla fase successiva clickando su Define. Nel campo Measure Name possono essere inseriti i nomi di variabili distinte che sono state misurate su ognuno dei livelli dei fattori (ad esempio, in tre momenti diversi del tempo sono stati ottenuti i punteggi di tre diversi test psicologici; questo consente di realizzare la cosiddetta ANOVA Multivariata per misure ripetute, vedi Sezione 6.6.5). 3 Per semplicità espositiva, si riporta qui una delle due possibili interpretazioni dell’effetto di interazione. Era possibile formulare anche l’interpretazione alternativa, ovvero che fosse il tempo di esposizione a moderare l’effetto della dimensione dello stimolo. Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia Figura 6.6.17 Impostazione dei fattori within in SPSS per la realizzazione di un’ANOVA fattoriale completamente within. Nella finestra successiva dobbiamo stare attenti ad assegnare ad ogni condizione la giusta variabile. Le condizioni sono indicate con due numeri fra parentesi separate da una virgola: il primo numero indica la condizione della prima variabile specificata nella finestra precedente, il secondo la condizione della seconda variabile. Poiché abbiamo inserito come prima variabile il Tempo di Esposizione e come seconda variabile la Dimensione dello Stimolo, il primo numero rappresenta i livelli del Tempo di Esposizione, il secondo quelli della Dimensione dello Stimolo (Figura 6.6.18). Figura 6.6.18 Assegnazione delle variabili alle condizioni per la realizzazione di di un’ANOVA fattoriale completamente within in SPSS SPSS offre tutta una serie di opzioni possibili per l’analisi. A noi però interessa soprattutto la sezione Options, in quanto ci permette di impostare i test post-hoc per gli effetti principali e per l’interazione (anche in questo caso è necessaria la modifica della sintassi di SPSS vista nella sezione 6.6.1), richiedere le statistiche descrittive e le dimensioni dell’effetto (Figura 6.6.19) Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia Figura 6.6.19 Impostazioni delle opzioni per la realizzazione di un’ANOVA fattoriale completamente within. Infine, impostiamo i grafici clickando su Plots. In questo caso chiediamo che vengano realizzati entrambi i grafici possibili, ossia quello con le categorie della variabile Tempo di Esposizione sull’asse orizzontale (Horizontal Axis) e le categorie della variabile Dimensione dello Stimolo rappresentate da linee di colore diverso (Separate Lines), e viceversa. L’output dell’analisi è riportato in Figura 6.6.204. Within-Subjects Factors Descriptive Statistics Measure: MEASURE_1 tempo 1 2 dimensio 1 2 3 1 2 3 Dependent Variable rt_100_pic rt_100_med rt_100_gra rt_500_pic rt_500_med rt_500_gra rt_100_pic rt_100_med rt_100_gra rt_500_pic rt_500_med rt_500_gra Mean 3392,50 3209,25 2796,25 3452,50 2571,25 2406,25 Std. Deviation 1545,220 1455,936 1219,531 1488,352 801,943 785,890 N 20 20 20 20 20 20 Mauchly's Test of Sphericityb Measure: MEASURE_1 Epsilon Within Subjects Effect tempo dimensio tempo * dimensio Mauchly's W 1,000 ,678 ,969 Approx. Chi-Square ,000 6,989 ,564 df Sig. 0 2 2 . ,030 ,754 Greenhous e-Geisser 1,000 ,757 ,970 a Huynh-Feldt 1,000 ,808 1,000 Lower-bound 1,000 ,500 ,500 Tests the null hypothesis that the error covariance matrix of the orthonormalized transformed dependent variables is proportional to an identity matrix. a. May be used to adjust the degrees of freedom for the averaged tests of significance. Corrected tests are displayed in the Tests of Within-Subjects Effects table. b. Design: Intercept Within Subjects Design: tempo+dimensio+tempo*dimensio 4 Per esigenze di spazio non vengono riportate in questo output le tabelle Multivariate Tests e Tests of Within-Subjects Contrasts, che comunque SPSS produce, poiché in questo caso non ci interessano. Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia Tests of Within-Subjects Effects Measure: MEASURE_1 Source tempo Error(tempo) dimensio Error(dimensio) tempo * dimensio Error(tempo*dimensio) Sphericity Assumed Greenhouse-Geisser Huynh-Feldt Lower-bound Sphericity Assumed Greenhouse-Geisser Huynh-Feldt Lower-bound Sphericity Assumed Greenhouse-Geisser Huynh-Feldt Lower-bound Sphericity Assumed Greenhouse-Geisser Huynh-Feldt Lower-bound Sphericity Assumed Greenhouse-Geisser Huynh-Feldt Lower-bound Sphericity Assumed Greenhouse-Geisser Huynh-Feldt Lower-bound Type III Sum of Squares 3123413,333 3123413,333 3123413,333 3123413,333 8266403,333 8266403,333 8266403,333 8266403,333 13883501,7 13883501,7 13883501,7 13883501,7 28902173,3 28902173,3 28902173,3 28902173,3 2504026,667 2504026,667 2504026,667 2504026,667 13792981,7 13792981,7 13792981,7 13792981,7 df 1 1,000 1,000 1,000 19 19,000 19,000 19,000 2 1,513 1,616 1,000 38 28,750 30,708 19,000 2 1,940 2,000 1,000 38 36,863 38,000 19,000 Mean Square 3123413,333 3123413,333 3123413,333 3123413,333 435073,860 435073,860 435073,860 435073,860 6941750,833 9175333,424 8590094,109 13883501,67 760583,509 1005309,389 941186,752 1521167,018 1252013,333 1290632,468 1252013,333 2504026,667 362973,202 374169,337 362973,202 725946,404 F 7,179 7,179 7,179 7,179 Sig. ,015 ,015 ,015 ,015 Partial Eta Squared ,274 ,274 ,274 ,274 9,127 9,127 9,127 9,127 ,001 ,002 ,001 ,007 ,324 ,324 ,324 ,324 3,449 3,449 3,449 3,449 ,042 ,044 ,042 ,079 ,154 ,154 ,154 ,154 Tests of Between-Subjects Effects Measure: MEASURE_1 Transformed Variable: Average Source Intercept Error Type III Sum of Squares 1059458613 128980537 df 1 19 Mean Square 1059458613 6788449,298 F 156,068 Sig. ,000 Partial Eta Squared ,891 Figura 6.6.20 Output di SPSS per gli effetti principali e di interazione di un’ANOVA fattoriale completamente within. Le prime due tabelle dell’output (Within-Subjects Factors e Descriptive Statistics) riassumono il disegno della ricerca e le statistiche descrittive delle varie condizioni. La tabella Mauchly’s Test of Sphericity ci informa sulla sfericità (ossia, omogeneità) delle varianze per tutti gli effetti. Notiamo che Sig. del fattore Dimensione è minore di ,05 (,030), per cui quando andremo a valutare la significatività dell’effetto nella tabella Tests of Within-Subjects Effects non consulteremo la riga di Sphericity Assumed, ma quella di Greenhouse-Geisser. Nessun problema, invece, per gli altri due effetti. Nella tabella seguente (Tests of Within-Subjects Effects), osserviamo come tutti e tre gli effetti siano statisticamente significativi (Sig. < ,05). Nel caso del Tempo di Esposizione e dell’effetto di interazione consultiamo la riga Sphericity Assumed, mentre nel caso dell’effetto principale di Dimensione dello Stimolo consultiamo Greenhouse-Geisser. Occorre prestare particolare attenzione alla valutazione della dimensione dell’effetto mediante la colonna Partial Eta Squared. Come già abbiamo visto anche nella sezione 6.6.1, una stima adeguata della dimensione SS effetto dell’effetto non si ottiene, come propone SPSS, con la formula , ma con SS effetto + SS errore SS effetto SS effetto + SS errore + SS between , dove SSbetween è il termine Error nella tabella Tests of Between Subjects Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia Effects. Quindi, se η2 parziale dell’effetto del tempo, così come riportato da SPSS, è 0,27, ossia SS effetto 3123413,333 = , la stima corretta di η2 è SS effetto + SS errore 3123413,333 + 8266403,333 SS effetto SS effetto + SS errore + SS between = 3123413,333 = 0,02 . Con lo stesso 3123413,333 + 8266403,333 + 128980537 procedimento individuiamo la stima corretta di η2 per gli altri due effetti (0,08 per l’effetto principale della Dimensione dello Stimolo, 0,02 per l’effetto di interazione). Poiché tutti gli effetti sono significativi, occorre consultare i risultati dei test post-hoc per individuare le condizioni “responsabili” di questa significatività. Nel caso del Tempo di Esposizione dello stimolo il confronto è uno solo, poiché la variabile dicotomica. Le Estimated Marginal Means ci mostrano che nella condizione 1 (100 msec) il tempo di reazione medio è maggiore rispetto a quello della condizione 2 (500 msec) (Figura 6.6.21)5. Estimates Measure: MEASURE_1 tempo 1 2 Mean 3132,667 2810,000 Std. Error 285,297 197,478 95% Confidence Interval Lower Bound Upper Bound 2535,533 3729,800 2396,673 3223,327 Pairwise Comparisons Measure: MEASURE_1 (I) tempo 1 2 (J) tempo 2 1 Mean Difference (I-J) 322,667* -322,667* Std. Error 120,426 120,426 a Sig. ,015 ,015 95% Confidence Interval for a Difference Lower Bound Upper Bound 70,612 574,722 -574,722 -70,612 Based on estimated marginal means *. The mean difference is significant at the ,05 level. a. Adjustment for multiple comparisons: Bonferroni. Figura 6.6.21 Estimated marginal means e confronti post-hoc per l’effetto principale del Tempo di Esposizione dello stimolo L’interpretazione del risultato è abbastanza ovvia: minore è il tempo di esposizione dello stimolo, indipendentemente dalla dimensiono dello stimolo, maggiore è il tempo che il soggetto impiega per rispondere. Per l’effetto principale della Dimensione dello Stimolo, invece, i confronti post-hoc ci servono per sapere quali confronti fra le coppie di condizioni sono significative. La Figura 6.6.22 mostra come nella condizione 1 (figura piccola) il tempo di reazione sia significativamente maggiore che nelle altre due (2 e 3, figura media e grande, rispettivamente), che però non sono significativamente diverse fra di loro (Sig. = ,28 > ,05). 5 In questa e nelle due figure successive non viene riportata la tabella Multivariate Tests. Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia Estimates Measure: MEASURE_1 dimensio 1 2 3 Mean 3422,500 2890,250 2601,250 Std. Error 332,640 229,125 211,170 95% Confidence Interval Lower Bound Upper Bound 2726,277 4118,723 2410,686 3369,814 2159,266 3043,234 Pairwise Comparisons Measure: MEASURE_1 (I) dimensio 1 (J) dimensio 2 3 1 3 1 2 2 3 Mean Difference (I-J) Std. Error 532,250* 166,945 821,250* 244,108 -532,250* 166,945 289,000 163,181 -821,250* 244,108 -289,000 163,181 a Sig. ,015 ,010 ,015 ,278 ,010 ,278 95% Confidence Interval for a Difference Lower Bound Upper Bound 94,003 970,497 180,440 1462,060 -970,497 -94,003 -139,368 717,368 -1462,060 -180,440 -717,368 139,368 Based on estimated marginal means *. The mean difference is significant at the ,05 level. a. Adjustment for multiple comparisons: Bonferroni. Figura 6.6.22 Estimated marginal means e confronti post-hoc per l’effetto principale del Tempo di Esposizione dello stimolo L’interpretazione del risultato è che per figure piccole, indipendentemente dal tempo di esposizione dello stimolo, il tempo di reazione è maggiore, mentre la dimensione medie e grande non sembra produrre tempi di reazione significativamente diversi. Vediamo infine le Estimated Marginal Means e i confronti post-hoc sull’effetto di interazione (Figura 6.6.23). Estimates Measure: MEASURE_1 tempo 1 2 dimensio 1 2 3 1 2 3 Mean 3392,500 3209,250 2796,250 3452,500 2571,250 2406,250 Std. Error 345,522 325,557 272,695 332,806 179,320 175,730 95% Confidence Interval Lower Bound Upper Bound 2669,315 4115,685 2527,851 3890,649 2225,492 3367,008 2755,930 4149,070 2195,929 2946,571 2038,442 2774,058 Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia Pairwise Comparisons Measure: MEASURE_1 dimensio 1 2 3 (I) tempo 1 2 1 2 1 2 (J) tempo 2 1 2 1 2 1 Mean Difference (I-J) Std. Error -60,000 133,012 60,000 133,012 638,000* 257,475 -638,000* 257,475 390,000* 179,211 -390,000* 179,211 a Sig. ,657 ,657 ,023 ,023 ,042 ,042 95% Confidence Interval for a Difference Lower Bound Upper Bound -338,397 218,397 -218,397 338,397 99,098 1176,902 -1176,902 -99,098 14,908 765,092 -765,092 -14,908 Based on estimated marginal means *. The mean difference is significant at the ,05 level. a. Adjustment for multiple comparisons: Bonferroni. Estimates Measure: MEASURE_1 tempo 1 2 dimensio 1 2 3 1 2 3 Mean 3392,500 3209,250 2796,250 3452,500 2571,250 2406,250 Std. Error 345,522 325,557 272,695 332,806 179,320 175,730 95% Confidence Interval Lower Bound Upper Bound 2669,315 4115,685 2527,851 3890,649 2225,492 3367,008 2755,930 4149,070 2195,929 2946,571 2038,442 2774,058 Pairwise Comparisons Measure: MEASURE_1 tempo 1 (I) dimensio 1 2 3 2 1 2 3 (J) dimensio 2 3 1 3 1 2 2 3 1 3 1 2 Mean Difference (I-J) Std. Error 183,250 155,543 596,250 279,992 -183,250 155,543 413,000 253,117 -596,250 279,992 -413,000 253,117 881,250* 266,860 1046,250* 265,910 -881,250* 266,860 165,000 168,781 -1046,250* 265,910 -165,000 168,781 a Sig. ,760 ,140 ,760 ,358 ,140 ,358 ,011 ,003 ,011 1,000 ,003 1,000 95% Confidence Interval for a Difference Lower Bound Upper Bound -225,068 591,568 -138,759 1331,259 -591,568 225,068 -251,460 1077,460 -1331,259 138,759 -1077,460 251,460 180,715 1581,785 348,208 1744,292 -1581,785 -180,715 -278,068 608,068 -1744,292 -348,208 -608,068 278,068 Based on estimated marginal means *. The mean difference is significant at the ,05 level. a. Adjustment for multiple comparisons: Bonferroni. Figura 6.6.23 Estimated marginal means e confronti post-hoc per l’effetto di interazione Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia Nelle prime due tabelle i confronti post-hoc sono stati eseguiti fra le condizioni del fattore Tempo di Esposizione su ogni livello del fattore Dimensione dello Stimolo. Notiamo come per figure piccole (condizione 1 del fattore Dimensione) la differenza nei tempi di reazione medie fra tempo di esposizione 100 msec (1) e 500 msec (2) non sia statisticamente significativa (Sig. = ,66), mentre lo sia sugli altri due livelli (figure medie [2] e grandi [3]: Sig. = ,02 e ,04, rispettivamente), sempre con tempi di reazione maggiori per la condizione 100 msec. Nella terza e nella quarta tabella, invece, i confronti post-hoc sono stati eseguiti fra le condizioni del fattore Dimensione dello Stimolo su ogni livello del fattore Tempo di Esposizione. In questo caso si osserva come non vi siano differenze significative nei tempi di reazione medi a stimoli di dimensioni diverse nella condizione 1 (100 msec) del fattore Tempo di Esposizione, mentre nella condizione 2 (500 msec) emerga lo stesso pattern di risultati osservato nei confronti post-hoc sull’effetto principale del fattore Dimensione dello Stimolo, ossia, tempi di reazione maggiori per figure piccole (1) rispetto a medie e grandi (2 e 3, rispettivamente), ma differenze non significative fra figure medie e grandi. La rappresentazione grafica delle possibili interpretazioni dell’effetto di interazione è riportata in Figura 6.6.24. Figura 6.6.24 Grafici di interazione per un'ANOVA completamente within Per riportare il risultato in un articolo scientifico o in una tesi di laurea riporteremo la tabella con le statistiche descrittive, uno dei due grafici in Figura 6.6.24 e scriveremo: E’ stata eseguita un’analisi della varianza fattoriale 2 × 3 completamente within (Tempo di Esposizione [100msec, 500msec] × Dimensione dello Stimolo [Piccola, Media, Grande]). Sono risultati significativi entrambi gli effetti principali (Tempo di Esposizione: F(1, 19) = 7,18, p = ,015, η2 parziale = 0,27; Dimensione dello Stimolo: F(1.51, 28.75) = 9,13, p = ,002, η2 parziale = 0,32; Interazione: F(2, 38) = 3,45, p = ,042, η2 parziale = 0,15). L’effetto principale del Tempo di Esposizione era dovuto ad un tempo di reazione medio maggiore per la condizione 100msec. I confronti post-hoc, eseguiti con correzione Bonferroni del livello di significatività fra le condizioni del fattore Dimensione dello Stimolo, hanno mostrato che nella condizione Piccola il tempo di reazione medio era maggiore rispetto alle condizioni Media e Grande, che però non differivano fra di loro. I confronti post-hoc sugli effetti di interazione, eseguiti con correzione Bonferroni del livello di significatività, hanno mostrato che per figure piccole la differenza nei tempi di reazione medie fra tempo di esposizione non era statisticamente significativa, mentre lo era sugli altri due livelli del fattore Dimensione dello Stimolo. Inoltre, sono emerse differenze significative nei tempi di reazione medi a stimoli di dimensioni diverse nella condizione 100 msec, mentre nella condizione 500 Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia msec è stato osservato lo stesso pattern di risultati osservato nei confronti post-hoc sull’effetto principale del fattore Dimensione dello Stimolo. 6.6.3 ANOVA fattoriale mista Quando alcuni dei fattori sono per gruppi indipendenti (between) e alcuni per misure ripetute (within), per studiare i loro effetti principali e di interazione si utilizza un’ANOVA fattoriale mista. Ad esempio, potrebbe essere il caso dei dati riportati in Tabella 6.6.4. Questi dati si riferiscono ad una ricerca in cui si intendeva valutare la prestazione di guida ad un simulatore (misurata come numero di errori) di due gruppi di soggetti: nel primo gruppo il soggetto doveva eseguire il compito mentre discuteva di un certo argomento al cellulare (con l'auricolare) con un amico (gruppo Cellulare), mentre nel secondo gruppo il soggetto parlava dello stesso argomento con un amico che però era seduto accanto a lui (gruppo Passeggero). I soggetti sono stati assegnati casualmente ai gruppi, e dovevano eseguire il compito a tre livelli di difficoltà: Facile, Medio, Difficile. L'ordine delle prove è stato controbilanciato per tutti i soggetti in tutti i gruppi in modo da evitare effetti di ordine e di sequenza. Tabella 6.6.4 Numero di errori Gruppo 0 0 0 0 0 1 1 1 1 1 Facile 21 20 28 22 28 24 23 23 24 23 Medio 39 34 35 34 38 36 33 32 31 31 Difficile 68 65 66 62 62 63 56 60 51 51 In questo caso il fattore between è la Modalità di Conversazione (di persona vs al cellulare), mentre quello within è il Livello di Difficoltà (facile, medio, difficile). Questo tipo di analisi può essere molto utile anche per confrontare i “profili" dei due diversi gruppi6. Obiettivo: verificare se vi è una differenza legata alla modalità di conversazione nel numero di errori alla guida, se vi sono differenze legate alla difficoltà della prova e se le differenze nella modalità di conversazione dipendono dalla difficoltà della prova (o se le differenze nella difficoltà della prova dipendono dalla modalità di conversazione) Variabili Variabile Indipendente 1: Modalità di conversazione (nominale, dicotomica: Passeggero, Cellulare → between) Variabile Indipendente 2: Difficoltà della prova (nominale, politomica: Facile, Medio, Difficile → within) Variabile Dipendente: Numero di errori alla prova di guida (a rapporti) 6 Per questo tipo di domanda di ricerca in realtà esiste un’analisi specifica, la profile analysis, che richiede un’analisi leggermente diversa degli effetti in questione. L’esposizione di questo argomento va al di là degli scopi di questo volume, per cui si rimanda il lettore, ad esempio, al sito: http://faculty.chass.ncsu.edu/garson/PA765/manova.htm#profile Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia Ipotesi: potrebbe esservi una effetto della modalità di conversazione indipendentemente dal livello di difficoltà della prova, del livello di difficoltà della prova indipendentemente dalla modalità di conversazione, oppure un effetto di interazione Modalità di Conversazione × Difficoltà. Effetti principali H0: µPasseggero = µCellulare → indipendentemente dalla difficoltà della prova, la popolazione da cui è stato estratto il gruppo che parla al cellulare ottiene un punteggio medio uguale quello della popolazione da cui è stato estratto il gruppo che parla dal vivo → non si riscontrano differenze nel numero di errori di guida legate alla modalità di conversazione H1: µPasseggero ≠ µCellulare → indipendentemente dalla difficoltà della prova, la popolazione da cui è stato estratto il gruppo che parla al cellulare ottiene un punteggio medio diverso quello della popolazione da cui è stato estratto il gruppo che parla dal vivo → si riscontrano differenze nel numero di errori di guida legate alla modalità di conversazione H0: µFacile = µMedio = µDifficile → indipendentemente dalla modalità di conversazione, le popolazioni a cui fanno riferimento le osservazioni nelle prove di guida ai vari livelli di difficoltà hanno punteggi medi uguali → non si riscontrano differenze nel numero di errori di guida in base alla difficoltà della prova H1: Almeno due medie diverse → indipendentemente dalla modalità di conversazione, le popolazioni a cui fanno riferimento le osservazioni nelle prove di guida ai vari livelli di difficoltà non hanno punteggi medi uguali → si riscontrano differenze nel numero di errori di guida in base alla difficoltà della prova Effetto di interazione7 H0: (µPasseggero − µCellulare)Facile = (µPasseggero − µCellulare)Medio = (µPasseggero − µCellulare)Difficile → la differenza fra i punteggi medi delle popolazioni da cui sono stati estratti il gruppo che parla al cellulare e quello che parla dal vivo è uguale per tutti i livelli di difficoltà della prova → la differenza nel numero di errori di guida legata non dipende dalla difficoltà della prova H1: Almeno una differenza è significativa → la differenza fra i punteggi medi delle popolazioni da cui sono stati estratti il gruppo che parla al cellulare e quello che parla dal vivo non è uguale per tutti i livelli di difficoltà della prova → la differenza nel numero di errori di guida legata dipende dalla difficoltà della prova Per realizzare l’analisi in SPSS, si procede come nel caso di un’ANOVA per misure ripetute o di un’ANOVA fattoriale completamente within. I dati vanno organizzati come in Figura 6.6.25. 7 Per semplicità espositiva, si riporta qui una delle due possibili interpretazioni dell’effetto di interazione. Era possibile formulare anche l’interpretazione alternativa, ovvero che le differenze fra i vari livelli difficoltà dipendono dalla modalità di conversazione Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia Figura 6.6.25 Organizzazione dei dati in SPSS per la realizzazione di un’ANOVA fattoriale mista Il percorso da seguire è Analyze → General Linear Model → Repeated Measures. Nella prima finestra indicheremo che il fattore within è uno solo, Livello di difficoltà, con 3 categorie ordinate (Figura 6.6.26). Figura 6.6.26 Definizione del fattore within nella realizzazione di un’ANOVA fattoriale mista Nella finestra seguente inseriremo le variabili coi punteggi di funzionamento sociali e lavorativo sui livelli della variabile within (campo Within-Subjects Variables), e il trattamento nel campo delle variabili between (Between-Subjects Variables) (Figura 6.6.27). Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia Figura 6.6.27 Impostazione dei fattori per la realizzazione di un’ANOVA fattoriale mista A questo punto utilizzeremo le Options per ottenere nell’output i test post-hoc per i due effetti principali e per l’interazione (anche in questo caso è necessaria la modifica della sintassi di SPSS vista nella sezione 6.6.18), le statistiche descrittive, i test di omogeneità delle varianza per i gruppi della variabile between e gli indici di dimensione dell’effetto. Inoltre, in Plots imposteremo la realizzazione dei due grafici di interazione possibili. L’output è riportato in Figura 6.6.28 9. Descriptive Statistics Within-Subjects Factors Measure: MEASURE_1 livello 1 2 3 Gruppo 8 Dependent Variable Facile Medio Difficile Facile Between-Subjects Factors Difficile 0 1 Value Label Cellulare Passegger o Medio N 6 Gruppo Cellulare Passeggero Total Cellulare Passeggero Total Cellulare Passeggero Total Mean 23,83 23,17 23,50 36,00 32,17 34,08 64,33 53,33 58,83 Std. Deviation 3,488 1,941 2,714 2,098 2,137 2,843 2,422 3,882 6,520 N 6 6 12 6 6 12 6 6 12 6 GLM Facile Medio Difficile BY Gruppo /WSFACTOR = livello 3 Polynomial /METHOD = SSTYPE(3) /PLOT = PROFILE( Gruppo*livello livello*Gruppo ) /EMMEANS = TABLES(Gruppo) COMPARE ADJ(BONFERRONI) /EMMEANS = TABLES(livello) COMPARE ADJ(BONFERRONI) /EMMEANS = TABLES(Gruppo*livello) COMPARE(gruppo) ADJ(BONFERRONI) /EMMEANS = TABLES(Gruppo*livello) COMPARE(livello) ADJ(BONFERRONI) /PRINT = DESCRIPTIVE ETASQ HOMOGENEITY /CRITERIA = ALPHA(.05) /WSDESIGN = livello /DESIGN = Gruppo . 9 Per esigenze di spazio non vengono riportate in questo output le tabelle Multivariate Tests e Tests of Within-Subjects Contrasts, che comunque SPSS produce, poiché in questo caso non ci interessano. Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia a Box's Test of Equality of Covariance Matrices Box's M F df1 df2 Sig. 12,635 1,404 6 724,528 ,210 Tests the null hypothesis that the observed covariance matrices of the dependent variables are equal across groups. a. Design: Intercept+Gruppo Within Subjects Design: livello Mauchly's Test of Sphericityb Measure: MEASURE_1 Epsilon Within Subjects Effect Mauchly's W livello ,846 Approx. Chi-Square 1,508 df Sig. ,471 2 Greenhous e-Geisser ,866 a Huynh-Feldt 1,000 Lower-bound ,500 Tests the null hypothesis that the error covariance matrix of the orthonormalized transformed dependent variables is proportional to an identity matrix. a. May be used to adjust the degrees of freedom for the averaged tests of significance. Corrected tests are displayed in the Tests of Within-Subjects Effects table. b. Design: Intercept+Gruppo Within Subjects Design: livello Tests of Within-Subjects Effects Measure: MEASURE_1 Source livello livello * Gruppo Error(livello) Type III Sum of Squares 7892,056 7892,056 7892,056 7892,056 168,167 168,167 168,167 168,167 163,111 163,111 163,111 163,111 Sphericity Assumed Greenhouse-Geisser Huynh-Feldt Lower-bound Sphericity Assumed Greenhouse-Geisser Huynh-Feldt Lower-bound Sphericity Assumed Greenhouse-Geisser Huynh-Feldt Lower-bound df 2 1,733 2,000 1,000 2 1,733 2,000 1,000 20 17,327 20,000 10,000 Mean Square 3946,028 4554,704 3946,028 7892,056 84,083 97,053 84,083 168,167 8,156 9,414 8,156 16,311 F 483,845 483,845 483,845 483,845 10,310 10,310 10,310 10,310 Sig. ,000 ,000 ,000 ,000 ,001 ,002 ,001 ,009 Partial Eta Squared ,980 ,980 ,980 ,980 ,508 ,508 ,508 ,508 a Levene's Test of Equality of Error Variances Facile Medio Difficile F 3,455 ,027 1,639 df1 df2 1 1 1 10 10 10 Sig. ,093 ,872 ,229 Tests the null hypothesis that the error variance of the dependent variable is equal across groups. a. Design: Intercept+Gruppo Within Subjects Design: livello Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia Tests of Between-Subjects Effects Measure: MEASURE_1 Transformed Variable: Average Source Intercept Gruppo Error Type III Sum of Squares 54211,361 240,250 66,056 df Mean Square 54211,361 240,250 6,606 1 1 10 F 8206,934 36,371 Sig. ,000 ,000 Partial Eta Squared ,999 ,784 Figura 6.6.28 Output degli effetti dei fattori per un’ANOVA fattoriale mista Le prime tre tabelle (Within-Subjects Factors, Between-Subjects Factors e Descriptive Statistics) riportano l’impostazione del disegno di ricerca e le statistiche descrittive. La tabella Box's Test of Equality of Covariance Matrices verifica l'ipotesi nulla che le relazioni fra il numero di errori nelle tre condizioni della variabile between siano omogenee nel gruppo Passeggero e nel gruppo Cellulare. Questa condizione è centrale soprattutto nell'analisi multivariata nella varianza (vedi più avanti Sezione 6.6.5): nel caso non fosse soddisfatta questa condizione, ad essere rigorosi, non potremmo procedere con l'analisi di confronto dei due gruppi, ma eseguire un'analisi separata per ogni gruppo. In questo caso non ci sono problemi, in quanto Sig. = ,210 > ,05. La tabella Mauchly’s Test of Sphericity ci informa che le varianze delle differenze nel numero di errori nelle tre condizioni di difficoltà sono sferiche (Sig. = ,471 > ,05), per cui nella tabella Tests of WithinSubjects Effects potremo consultare, per l’effetto principale della Livello di Difficoltà, la riga Sphericity Assumed (in caso contrario avremmo dovuto consultare la riga Greenhouse-Geisser). Nella tabella Within-Subjects Effects notiamo che sono significativi sia l'effetto principale del Livello di Difficoltà, sia la sua interazione con la modalità di conversazione (Gruppo). Nella tabella Levene's Test of Equality of Error Variances sono riportati i risultati delle analisi circa l'omogeneità delle varianze dei gruppi definiti dalla variabile between per ogni livello della variabile within. In tutti e tre i casi l'assunzione è rispettata (Sig. > ,05). Nella tabella Tests of Between-Subjects Effects troviamo infine l’effetto principale del fattore between, ossia della modalità di conversazione, che è statisticamente significativo (Sig.< ,001). Possiamo quindi concludere che vi è un effetto della difficoltà della prova indipendentemente dalla modalità di conversazione, un effetto della modalità di conversazione indipendentemente dalla difficoltà della prova, e un effetto di interazione. I test post-hoc, a questo punto ci aiuteranno ad andare più in profondità con le analisi. Non si farà menzione di test post-hoc per l'effetto principale della modalità di conversazione, in quanto questa ha due soli livelli. Dalla tabella delle statistiche descrittive si nota facilmente come sia sempre il gruppo Cellulare quello a commettere il maggior numero di errori. Nella Figura 6.6.29 sono riportati i test post-hoc per l'effetto principale della variabile Livello di Difficoltà. Estimates Measure: MEASURE_1 livello 1 2 3 Mean 23,500 34,083 58,833 Std. Error ,815 ,611 ,934 95% Confidence Interval Lower Bound Upper Bound 21,685 25,315 32,721 35,445 56,752 60,914 Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia Pairwise Comparisons Measure: MEASURE_1 (I) livello 1 2 3 (J) livello 2 3 1 3 1 2 Mean Difference (I-J) -10,583* -35,333* 10,583* -24,750* 35,333* 24,750* Std. Error 1,114 1,367 1,114 ,984 1,367 ,984 a Sig. ,000 ,000 ,000 ,000 ,000 ,000 95% Confidence Interval for a Difference Lower Bound Upper Bound -13,780 -7,387 -39,258 -31,409 7,387 13,780 -27,574 -21,926 31,409 39,258 21,926 27,574 Based on estimated marginal means *. The mean difference is significant at the ,05 level. a. Adjustment for multiple comparisons: Bonferroni. Figura 6.6.29 Output dei test post-hoc per l'effetto principale della variabile Livello di Difficoltà I risultati riportati in Figura 6.6.29 mostrano come al crescere del livello di difficoltà della prova aumenti anche il numero degli errori alla prova di guida. Tutti i confronti a coppie fra i livelli di difficoltà sono statisticamente significativi (Sig. < ,05). Il risultato più interessante delle analisi, però, è la significatività dell'effetto di interazione Modalità di Conversazione × Livello di Difficoltà. Possiamo supporre, infatti, che al variare del livello di difficoltà della prova l'effetto della modalità di conversazione si modifichi. L'osservazione dei grafici con le medie di Figura 6.6.30 sembra confermare questa ipotesi. Figura 6.6.30. Grafici di interazione Modalità di Conversazione × Livello di Difficoltà Per giustificare la conclusione a livello statistico, occorre valutare i risultati dei test post-hoc (Figura 6.6.31). Estimates Measure: MEASURE_1 Gruppo Cellulare Passeggero livello 1 2 3 1 2 3 Mean 23,833 36,000 64,333 23,167 32,167 53,333 Std. Error 1,152 ,864 1,321 1,152 ,864 1,321 95% Confidence Interval Lower Bound Upper Bound 21,266 26,401 34,074 37,926 61,390 67,276 20,599 25,734 30,241 34,093 50,390 56,276 Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia Pairwise Comparisons Measure: MEASURE_1 livello 1 2 3 (I) Gruppo Cellulare Passeggero Cellulare Passeggero Cellulare Passeggero (J) Gruppo Passeggero Cellulare Passeggero Cellulare Passeggero Cellulare Mean Difference (I-J) ,667 -,667 3,833* -3,833* 11,000* -11,000* a Std. Error 1,630 1,630 1,222 1,222 1,868 1,868 Sig. ,691 ,691 ,011 ,011 ,000 ,000 95% Confidence Interval for a Difference Lower Bound Upper Bound -2,964 4,298 -4,298 2,964 1,109 6,557 -6,557 -1,109 6,838 15,162 -15,162 -6,838 Based on estimated marginal means *. The mean difference is significant at the ,05 level. a. Adjustment for multiple comparisons: Bonferroni. Estimates Measure: MEASURE_1 Gruppo Cellulare Passeggero livello 1 2 3 1 2 3 Mean 23,833 36,000 64,333 23,167 32,167 53,333 Std. Error 1,152 ,864 1,321 1,152 ,864 1,321 95% Confidence Interval Lower Bound Upper Bound 21,266 26,401 34,074 37,926 61,390 67,276 20,599 25,734 30,241 34,093 50,390 56,276 Pairwise Comparisons Measure: MEASURE_1 Gruppo Cellulare (I) livello 1 2 3 Passeggero 1 2 3 (J) livello 2 3 1 3 1 2 2 3 1 3 1 2 Mean Difference (I-J) -12,167* -40,500* 12,167* -28,333* 40,500* 28,333* -9,000* -30,167* 9,000* -21,167* 30,167* 21,167* Std. Error 1,575 1,934 1,575 1,391 1,934 1,391 1,575 1,934 1,575 1,391 1,934 1,391 a Sig. ,000 ,000 ,000 ,000 ,000 ,000 ,001 ,000 ,001 ,000 ,000 ,000 95% Confidence Interval for a Difference Lower Bound Upper Bound -16,687 -7,646 -46,050 -34,950 7,646 16,687 -32,327 -24,340 34,950 46,050 24,340 32,327 -13,520 -4,480 -35,716 -24,617 4,480 13,520 -25,160 -17,173 24,617 35,716 17,173 25,160 Based on estimated marginal means *. The mean difference is significant at the ,05 level. a. Adjustment for multiple comparisons: Bonferroni. Figura 6.6.31. Test post-hoc per l'effetto di interazione Modalità di Conversazione × Livello di Difficoltà Nelle prime due tabelle vengono riportate le medie e i relativi confronti di ogni gruppo definito dalla variabile between per ogni categoria del Livello di Difficoltà. I risultati mostrano che al livello di difficoltà più basso non c'è una differenza significativa fra le prestazioni dei due gruppi, mentre la differenza risulta significativa per i livelli di difficoltà successivi, sempre con medie maggiori (ossia, maggior numero di errori) nel gruppo Cellulare. Le ultime due tabelle della Figura 6.6.31, invece, mostrano le medie e i relativi confronti di ogni livello di difficoltà per ogni categoria della variabile Modalità di Conversazione. Tutti i possibili confronti sono significativi, per cui possiamo concludere che il Livello Difficile produce Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia un numero di errori sistematicamente maggiori del Livello Medio, che a sua volta produce un numero di errori sistematicamente maggiore del Livello Facile. La significatività dell'effetto di interazione Modalità di Conversazione × Livello di Difficoltà sembra quindi dovuto al fatto che al livello più basso di difficoltà la simulazione della telefonata non produce un numero di errori statisticamente maggiore rispetto a quello della simulazione del dialogo in presenza dell'interlocutore, mentre questo avviene per tutti gli altri livelli di difficoltà della prova. Per riportare il risultato in un articolo scientifico o in una tesi di laurea riporteremo la tabella con le statistiche descrittive, uno dei due grafici in Figura 6.6.31 e scriveremo: E’ stata eseguita un’analisi della varianza fattoriale mista 2 × 3 (Modalità di Conversazione: [Cellulare, Passeggero; between] × Livello di Difficoltà [Facile, Medio, Difficile; within]. Gli effetti principali sono risultati statisticamente significativi (Livello di Difficoltà: F(2, 20) = 483,85, p < ,001, η2 parziale = 0,98; Modalità di Conversazione: F(1, 10) = 36,37, p < ,001, η2 parziale = 0,78, Cellulare > Passeggero), così come l’interazione: F(2, 20) = 10,31, p = ,001, η2 parziale = 0,51). I confronti post-hoc, eseguiti con correzione Bonferroni del livello di significatività, hanno mostrato che l’effetto principale del Livello di Difficoltà era dovuto al fatto che ogni livello di difficoltà produceva un numero medio di errori significativamente superiore a quello precedente (Difficile > Medio > Facile). I confronti post-hoc eseguiti per esaminare le ragioni dell'effetto di interazione hanno mostrato che questo pattern di risultati si riproduceva indipendentemente dalla modalità di conversazione, e che al livello più basso di difficoltà la simulazione della telefonata non produceva un numero di errori statisticamente maggiore rispetto a quello della simulazione del dialogo in presenza dell'interlocutore, mentre questo avveniva per tutti gli altri livelli di difficoltà della prova. Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia 6.6.4 Analisi della covarianza (ANCOVA) Quando una delle potenziali variabili indipendenti è metrica, ossia misurata su scala a intervalli o rapporti, è possibile inserirla nel modello lineare come covariata. L’analisi dei dati prende quindi il nome di analisi della covarianza (ANCOVA), e consente di esaminare la relazione fra le variabili metriche controllando la variabile categoriale (fattore), o viceversa. Una delle due variabili indipendenti, infatti, potrebbe sopprimere l’effetto dell’altra: a livello statistico, quindi, una delle due variabili indipendenti andrebbe a gonfiare la varianza di errore, rendendo il test F per l’altra variabile indipendente non significativo. Naturalmente è possibile anche il contrario, ossia che l’effetto della seconda variabile indipendente gonfi l’effetto della prima, facendo emergere a livello statistico un effetto che invece non c’è. In questo senso, un’ANCOVA consente di aumentare la precisione nelle analisi dei dati fornendo un controllo statistico per le variabili estranee, soprattutto quando il controllo diretto di queste variabili mediante il disegno sperimentale è impraticabile. Ad esempio, l’ANCOVA permette di rimuovere statisticamente le differenze preesistenti fra gruppi che sono utilizzati in test sperimentali ma ai quali i soggetti non sono stati assegnati in modo casuale. Vediamo un paio di esempi. Supponiamo di voler indagare l’effetto del metodo di studio per l’esame di Tecniche di Ricerca e Analisi dei Dati, e di aver ottenuto informazioni su tre gruppi di studenti che si sono preparati seguendo il tutorato didattico della facoltà (Tutorato), studiando assieme ad altri compagni (Gruppo) o da soli (Individuale). Di primo acchito sembrerebbe molto semplice rispondere alla domanda di ricerca, perché basterebbe realizzare un’ANOVA per gruppi indipendenti prendendo come variabile dipendente il voto all’esame. Tuttavia, è verosimile pensare che una certa quota di variabilità del voto all’esame possa essere spiegata, indipendentemente dal metodo di studio, anche dal voto che gli stessi studenti avevano preso all’esame di Psicometria del primo anno. Questa informazione va quindi a costituire una covariata del modello lineare per cui: y = µ + α i + β ( X ij − M x ) + ε dove µ è la media generale fissa della popolazione, α è l’effetto del fattore Metodo di Studio, β è la variazione media che ci attendiamo in y per un cambiamento unitario del valore della covariata (ossia, il voto a Psicometria), ε è il termine di errore. Si noti che in questo modello non è contemplato l’effetto di interazione fattore × covariata, in quanto una delle assunzioni dell’ANCOVA è che il valore di β è uguale per tutti i livelli del fattore. SPSS, infatti, di default non inserisce questo termine nell’ANCOVA10. La suddivisione della “torta” della variabilità della variabile dipendente avviene quindi come illustrato in Figura 6.6.32. 10 E’ però possibile richiederlo clickando su Model e spuntando Custom nel riquadro Specify Model. A questo punto selezioniamo con un click del tasto sinistro del mouse entrambi i fattori (Gruppo e Psicometria_Cov) e nel menu a e spostiamo i due effetti tendina del riquadro Build Term(s) scegliamo Main Effects. A quel punto clickiamo su principali nel campo Model. Per inserire nel modello lineare anche il termine di interazione, occorre selezionare di nuovo le due variabili indipendenti, dal menu a tendina del riquadro Build Term(s) scegliere Interaction e premere su . Nel campo Model quel punto comparirà anche la dicitura gruppo*psicometria_cov. Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia Figura 6.6.32 Suddivisione della devianza della variabile dipendente in base agli effetti delle variabili indipendenti in un’ANCOVA (nel modello si assume che la devianza dovuta all’interazione covariate × fattore sia uguale a zero) Supponiamo di aver ottenuto i dati riportati in Tabella 6.6.5 Tabella 6.6.5 Dati relativi all'esito dell'esame di Tecnica di Ricerca e Analisi dei Dati in tre gruppi di soggetti definiti dal metodo di studio (0 = Tutorato, 1 = Gruppo; 2 = Individuale) e al voto conseguito all'esame di Psicometria Voto Tecniche di Ricerca Metodo di Studio Voto Psicometria e Analisi dei Dati (fattore) (covariata) (variabile dipendente) 0 25 28 0 22 25 0 22 27 0 23 27 1 20 21 1 25 29 1 19 22 1 20 24 2 25 23 2 25 27 2 24 24 2 21 20 Se eseguissimo delle analisi della varianza separatamente per il voto a Psicometria e quello a Tecniche di Ricerca e Analisi dei Dati, osserveremmo che non ci sono differenze legate al metodo di studio (Psicometria: F(2, 9) = 1,63, p = ,25; Tecniche di Ricerca: F(2, 9) = 1,88, p = ,21). Ma cosa succede se consideriamo tutte le variabili in un unico modello? Obiettivo: verificare se vi è una differenza legata al metodo di studio nel voto all’esame di Tecniche di Ricerca e Analisi dei Dati, al netto del voto ottenuto a Psicometria Variabili Variabile Indipendente 1 (fattore): Metodo di Studio (nominale, politomica: Tutorato, Gruppo, Individuale) Variabile Indipendente 2 (covariata): Voto Psicometria (a intervalli) Variabile Dipendente: Voto Tecniche di Ricerca e Analisi dei Dati (a intervalli) Ipotesi: potrebbe esservi una effetto del metodo di studio indipendentemente dal voto a Psicometria, un effetto del voto a Psicometria indipendentemente dal metodo di studio, oppure un effetto di interazione del metodo di studio × voto psicometria Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia Effetti principali H0: µTutorato = µGruppo = µIndividuale → indipendentemente dal voto a Psicometria, le popolazioni da cui sono stati estratti i tre gruppi ottengono all’esame di Tecniche di Ricerca e Analisi dei Dati lo stesso voto medio → non si riscontrano differenze di voto legate al titolo di studio H1: Almeno due medie diverse → indipendentemente dal voto a Psicometria, le popolazioni da cui sono stati estratti i tre gruppi ottengono all’esame di Tecniche di Ricerca e Analisi dei Dati non hanno lo stesso voto medio → si riscontrano differenze di voto legate al metodo di studio, da indagare mediante test post-hoc H0: β = 0 → indipendentemente dal metodo di studio, la covariata (voto a Psicometria) non ha alcun effetto sul voto a Tecniche di Ricerca e Analisi dei Dati H1: β ≠ 0 → indipendentemente dal metodo di studio, la covariata (voto a Psicometria) ha un qualche effetto sul voto a Tecniche di Ricerca e Analisi dei Dati Eventuale effetto di interazione (non inserito nei modelli ANCOVA standard) H0: β uguali per ogni livello del titolo di studio → la covariata (voto a Psicometria) ha lo stesso effetto per tutti i livelli del metodo di studio H1: Almeno due β diversi → la covariata (voto a Psicometria) non ha lo stesso effetto per tutti i livelli del metodo di studio In SPSS i dati vanno inseriti come in Figura 6.6.33 Figura 6.6.33 Inserimento dati in SPSS per la realizzazione di un’ANCOVA Le covariate possono essere inserite nell’apposito campo in qualunque tipo di analisi (Univariate, Multivariate, Repeated Measures) del menu Analyze → General Linear Model. In questo caso, poiché il fattore è una variabile between e la variabile dipendente una sola, utilizziamo il modulo Univariate, ma sono possibili analisi della covarianza che includano più di un fattore, fattori sia between che within, più di una variabile dipendente. L’impostazione dell’analisi è mostrata in Figura 6.6.34. Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia Figura 6.6.34 Impostazione di un’ANCOVA in SPSS Si noti in Figura 6.6.34 come sia grigiato il tasto Post-Hoc. Questo accade sempre quando si inserisce una covariata nel modello, perché una volta rimossa dalla variabile dipendente la variabilità dovuta alla covariata non è più possibile realizzare i post-hoc disponibili in questa opzione. Rimane però possibile impostare i post-hoc con correzione Bonferroni per i livelli del fattore in Options, che è quello che facciamo anche in questo caso, spuntando anche le casella per la stima della dimensione dell’effetto (Estimates of effect size). L’effetto della covariata non prevede post-hoc, perché è fondamentalmente una correlazione (si veda il Capitolo 7). Dopo aver clickato su Continue e quindi su OK, si otterrà l’ouput di Figura 6.6.35. La prima tabella (Between-Subjects Factors), che contiene il riassunto del disegno di ricerca, non è rappresentata per brevità. Tests of Between-Subjects Effects Dependent Variable: tecniche_vd Source Corrected Model Intercept psicometria_cov metodo Error Total Corrected Total Type III Sum of Squares 75,603a ,106 51,103 35,805 16,647 7443,000 92,250 df 3 1 1 2 8 12 11 Mean Square 25,201 ,106 51,103 17,903 2,081 F 12,111 ,051 24,559 8,604 Sig. ,002 ,827 ,001 ,010 Partial Eta Squared ,820 ,006 ,754 ,683 a. R Squared = ,820 (Adjusted R Squared = ,752) Estimates Dependent Variable: tecniche_vd metodo Tutorato Gruppo Individuale Mean Std. Error 26,272a ,728 25,818a ,809 22,160a ,770 95% Confidence Interval Lower Bound Upper Bound 24,593 27,950 23,952 27,684 20,384 23,936 a. Covariates appearing in the model are evaluated at the following values: psicometria_cov = 22,58. Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia Pairwise Comparisons Dependent Variable: tecniche_vd (I) metodo Tutorato Gruppo Individuale (J) metodo Gruppo Individuale Tutorato Individuale Tutorato Gruppo Mean Difference (I-J) ,453 4,111* -,453 3,658* -4,111* -3,658* Std. Error 1,120 1,035 1,120 1,203 1,035 1,203 a Sig. 1,000 ,012 1,000 ,048 ,012 ,048 95% Confidence Interval for a Difference Lower Bound Upper Bound -2,926 3,832 ,991 7,232 -3,832 2,926 ,031 7,285 -7,232 -,991 -7,285 -,031 Based on estimated marginal means *. The mean difference is significant at the ,05 level. a. Adjustment for multiple comparisons: Bonferroni. Figura 6.6.35 Output di SPSS per un’ANCOVA Nella prima tabella (Test of Between-Subjects Effects) viene riportata la significatività di tutti gli effetti. Si noti come sia significativo sia l’effetto del fattore (metodo) che quello della covariata (psicometria_cov). Si ricorda che per una valutazione più precisa della dimensione dell’effetto occorre dividere la devianza dell’effetto per quella corrispondente a Corrected Total. quando andiamo a valutare i test post-hoc per i livelli del fattore, si noti che a pie’ delle tabella Estimates sia indicato che quei valori sono corretti per l’effetto della covariata, ed è su questi che sono stati eseguiti i test post-hoc della tabella Pairwise Comparisons. Si osservi come vi sia una differenza significativa fra Tutorato e Individuale e fra Gruppo e Individuale, sempre con Individuale che presenta i punteggi più bassi. Questo risultato significa che, al netto del voto di Psicometria, all’esame di Tecniche di Ricerca e Analisi dei Dati chi ha seguito il tutorato didattico di facoltà o ha studiato in gruppo in media ha ottenuto un voto superiore rispetto a chi ha studiato da solo. Per riportare il risultato in un articolo scientifico o in una tesi di laurea riporteremo la tabella con le statistiche descrittive, il grafico con le medie e scriveremo: E’ stata eseguita un’analisi della covarianza con fattore Metodo di Studio (Tutorato, Gruppo, Individuale) e covariata Voto all’esame di Psicometria. Gli effetti principali sono risultati statisticamente significativi (Metodo di Studio: F(2, 8) = 8,60, p = ,010, η2 parziale = 0,68; Voto Psicometria: F(1, 8) = 24,56, p = ,001, η2 parziale = 0,75). I confronti post-hoc, eseguiti con correzione Bonferroni del livello di significatività, hanno mostrato che chi ha seguito il tutorato didattico di facoltà o ha studiato in gruppo ha ottenuto in media una votazione media superiore a chi ha studiato individualmente. Un’altra importante applicazione dell’ANCOVA riguarda i casi in cui si ha un disegno misto in cui vi è un gruppo sperimentale e un gruppo di controllo e una serie di misure ripetute. Se è possibile assegnare i soggetti casualmente ai due livelli di trattamento, i due gruppi risultanti dovrebbero essere omogenei per tutte le caratteristiche di interesse, compreso il punteggio nella variabile dipendente in assenza di trattamento. Se però questa operazione di controllo non è possibile, può darsi che i gruppi non siano omogenei fin dall’inizio, per cui gli effetti del trattamento potrebbero essere distorti da questa disomogeneità iniziale. Consideriamo il caso in cui un ricercatore intenda studiare i benefici dell’aggiunta di un training di assertività al normale protocollo terapeutico per la cura dell’anoressia. Tutte le pazienti, quindi, seguiranno il protocollo standard, ma a metà di esse sarà proposto di partecipare ad un corso per lo sviluppo dell’assertività. Se consideriamo come variabile dipendente il punteggio alla scala Impulso alla Magrezza (IM, a punteggi maggiori corrisponde un maggior grado di psicopatologia) del test Eating Disorder Inventory II (Garner, 1991), potremmo aspettarci che all’inizio del trattamento i due gruppi abbiamo lo stesso punteggio alla scala IM solo se le pazienti venissero assegnate ai gruppi mediante una procedura Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia randomizzata. Se però questo non è possibile, perché possono partecipare al training solo le pazienti residenti in città, mentre quelle fuori città no, allora occorre controllare che non vi sia una disomogeneità iniziale nel punteggio alla scala IM. Supponiamo che la scala venga somministrata in tre occasioni (Inizio del trattamento; dopo 3 mesi; dopo 6 mesi) e che i dati siano quelli riportati in Tabella 6.6.611. Tabella 6.6.6 Punteggi alla scala Impulso alla Magrezza del test EDI-2 per due gruppi (Training, NoTraining di assertività) in tre diversi momenti della terapia Condizione Inizio 3 mesi 6 mesi 0 20 14 14 0 20 16 12 0 24 16 16 0 30 20 18 0 26 22 18 1 18 14 5 1 14 12 4 1 16 14 4 1 10 8 3 1 16 14 6 Nota: 0 = gruppo di controllo (no training); 1 = gruppo sperimentale (training) Se realizzassimo una semplice ANOVA fattoriale mista 2 × 3 (variabile between Condizione: No Training; variabile within: Tempo: Inizio, 3 mesi, 6 mesi) otterremmo che entrambi gli effetti principali e l’effetto di interazione sono significativi (Tempo: F(2, 16) = 105,33, p < ,001; Condizione: F(1, 8) = 24,55, p = ,001; Interazione: F(2, 16) = 11,11, p = ,001), il che ci porterebbe a concludere che il training ha effetto indipendentemente dal miglioramento, che avviene comunque in virtù del fatto che il protocollo di intervento viene applicato anche al gruppo di controllo. L’interazione, come mostrato in Figura 6.6.36, suggerisce inoltre che il training sembra potenziare l’effetto del protocollo, dato che la diminuzione del punteggio di IM è più ripida dal Tempo 2 al Tempo 3 per il gruppo Training rispetto al gruppo di controllo. Nondimeno, dallo stesso si grafico si nota che i due gruppi non partissero dallo stesso punteggio di IM al Tempo 1. Un semplice test t per campioni indipendenti può provare che la differenza era significativa (t(8) = 3,94, p = ,004). Questa differenza iniziale ha sicuramente avuto un’influenza sul livello dei punteggi ottenuti in seguito, per cui, visto che non si è potuta controllare con l’assegnazione randomizzata questa variabile, si procede al controllo statistico mediante l’ANCOVA. In pratica, realizziamo un’analisi in cui la variabile within ha due livelli (Tempo 2 e Tempo 3), la between è immutata, e il punteggio di IM all’Inizio del trattamento è la covariata. 11 I punteggi alla scala IM sono stati riscalati rispetto agli originali per facilitare l’esposizione Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia Figura 6.6.36 Grafico di interazione Tempo × Condizione Obiettivo: verificare se il training di assertività migliora la riuscita dell’intervento, indipendentemente e in interazione col protocollo, al netto delle differenze iniziali fra il gruppo sperimentale e il gruppo di controllo nei punteggi della variabile dipendente Variabili Variabile Indipendente 1 (fattore): Condizione (nominale, dicotomica: No Training, Training, between) Variabile Indipendente 2 (fattore): Tempo (nominale, dicotomica: 3 mesi, 6 mesi, within) Variabile Indipendente 3 (covariata): Punteggio alla scala IM all’inizio del trattamento (ad intervalli) Variabile Dipendente: Punteggio alla scala IM (a intervalli) Ipotesi: potrebbe esservi una effetto del tempo indipendentemente dalla condizione e dal punteggio iniziale, un effetto della condizione indipendentemente dal punteggio iniziale e del tempo, un effetto del punteggio iniziale indipendentemente dal tempo e dalla condizione, oppure un effetto di interazione del tempo × condizione indipendente dal punteggio iniziale. Effetti principali H0: µTraining = µNo training → indipendentemente dal tempo e dal punteggio iniziale, le popolazioni da cui sono stati estratti i due gruppi ottengono alla scala IM lo stesso punteggio medio → non si riscontrano differenze di punteggio legate alla condizione H1: µTraining ≠ µNo training → indipendentemente dal tempo e dal punteggio iniziale, le popolazioni da cui sono stati estratti i due gruppi non ottengono alla scala IM lo stesso punteggio medio → si riscontrano differenze di punteggio legate alla condizione H0: µ3mesi = µ6mesi → indipendentemente dalla condizione e dal punteggio iniziale, la popolazione a cui fanno riferimento le osservazioni a 3 mesi hanno un punteggio medio alla scala IM uguale alla popolazione a cui fanno riferimento le osservazioni a 6 mesi → non si riscontrano differenze di punteggio legate al tempo H1: µ3mesi ≠ µ6mesi → indipendentemente dalla condizione e dal punteggio iniziale, la popolazione a cui fanno riferimento le osservazioni a 3 mesi hanno un punteggio medio alla scala IM diverso Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia rispetto alla popolazione a cui fanno riferimento le osservazioni a 6 mesi → si riscontrano differenze di punteggio legate al tempo H0: β = 0 → indipendentemente dalla condizione e dal tempo, la covariata (punteggio all’Inizio del trattamento) non ha alcun effetto sui punteggi successivi H1: β ≠ 0 → indipendentemente dalla condizione e dal tempo, la covariata (punteggio all’Inizio del trattamento) ha un qualche effetto sui punteggi successivi Eventuale di interazione H0: (µ3mesi − µ6mesi)Training = (µ3mesi − µ6mesi)NoTraining, oppure (µTraining − µNoTraining)3mesi = (µTraining − µNoTraining)6mesi → la differenza fra i punteggi medi delle popolazioni a cui fanno riferimento le osservazioni per un tempo di esposizione a 3 e 6 mesi è uguale per tutte le condizioni, oppure la differenza fra i punteggi medi delle popolazioni a cui fanno riferimento il gruppo Training e il gruppo NoTraining è uguale per tutte le rilevazioni → il tempo non modera l’effetto della condizione, o viceversa H1: Almeno una differenza è significativa → la differenza fra i punteggi medi delle popolazioni a cui fanno riferimento le osservazioni per un tempo di esposizione a 3 e 6 mesi non è uguale per tutte le condizioni, oppure la differenza fra i punteggi medi delle popolazioni a cui fanno riferimento il gruppo Training e il gruppo NoTraining non è uguale per tutte le rilevazioni → il tempo modera l’effetto della condizione, o viceversa In SPSS seguiamo il percorso Analyze → General Linear Model → Repeated Measures, impostiamo un fattore within a 2 livelli (Time), e inseriamo la variabile Inizio nel campo Covariates, come in Figura 6.6.37. Figura 6.6.37 Impostazione di un’ANCOVA in SPSS in cui il punteggio alla prima rilevazione è la covariata In questo caso non c’è bisogno dei post-hoc per gli effetti principali perché sia la variabile between che quella within, adesso, sono a dicotomiche, ma lo impostiamo lo stesso in Options per ottenere le medie stimate e, soprattutto, impostiamo i post-hoc per l’effetto di interazione, con l’opportuna modifica nella sintassi di SPSS. Impostiamo in Options anche la produzione delle statistiche descrittive e della dimensione dell’effetto. La Figura 6.6.38 riporta le sole tabelle necessarie ai fini Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia della valutazione degli effetti12. Per non appesantire l'esposizione non sono riportati i dati relativi ai test di omogeneità delle varianze come abbiamo visto per l'ANOVA mista, ma nella pratica è sempre consigliabile ispezionarli prima di procedere all'interpretazione dei risultati. Tests of Within-Subjects Effects Measure: MEASURE_1 Source time time * Inizio time * gruppo Error(time) Sphericity Assumed Greenhouse-Geisser Huynh-Feldt Lower-bound Sphericity Assumed Greenhouse-Geisser Huynh-Feldt Lower-bound Sphericity Assumed Greenhouse-Geisser Huynh-Feldt Lower-bound Sphericity Assumed Greenhouse-Geisser Huynh-Feldt Lower-bound Type III Sum of Squares ,073 ,073 ,073 ,073 2,647 2,647 2,647 2,647 27,366 27,366 27,366 27,366 12,353 12,353 12,353 12,353 df Mean Square ,073 ,073 ,073 ,073 2,647 2,647 2,647 2,647 27,366 27,366 27,366 27,366 1,765 1,765 1,765 1,765 1 1,000 1,000 1,000 1 1,000 1,000 1,000 1 1,000 1,000 1,000 7 7,000 7,000 7,000 F ,041 ,041 ,041 ,041 1,500 1,500 1,500 1,500 15,507 15,507 15,507 15,507 Sig. ,845 ,845 ,845 ,845 ,260 ,260 ,260 ,260 ,006 ,006 ,006 ,006 Partial Eta Squared ,006 ,006 ,006 ,006 ,176 ,176 ,176 ,176 ,689 ,689 ,689 ,689 Tests of Between-Subjects Effects Measure: MEASURE_1 Transformed Variable: Average Source Intercept Inizio gruppo Error Type III Sum of Squares 1,060 71,576 14,512 16,224 df 1 1 1 7 Mean Square 1,060 71,576 14,512 2,318 F ,457 30,883 6,261 Sig. ,521 ,001 ,041 Partial Eta Squared ,061 ,815 ,472 Figura 6.6.38 Effetti principali e di interazione di un’ANCOVA fattoriale mista Si noti come il Tempo (time) non abbia più un effetto principale significativo, mentre rimangano significativi gli effetti principali del gruppo e dell’interazione. Inoltre, è significativo l’effetto della covariata: a questo punto, però, che vi fosse una disomogeneità iniziale fra i gruppi non ci interessa più, visto che il suo effetto è stato rimosso statisticamente. Ispezionando la tabella in Figura 6.6.39 possiamo concludere che chi segue in training, al netto di tutti gli altri effetti, ottiene punteggi di IM inferiori. Estimates Measure: MEASURE_1 gruppo Controllo Training Mean Std. Error 13,962a ,676 11,038a ,676 95% Confidence Interval Lower Bound Upper Bound 12,363 15,561 9,439 12,637 a. Covariates appearing in the model are evaluated at the following values: Inizio = 19,40. Figura 6.6.38 Medie stimate dei gruppi Training e Controllo SPSS riporta anche l’effetto di interazione fattore within (time) × covariata (inizio), che non è eliminabile dal modello. 12 Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia I test post-hoc sull’effetto di interazione mostrano come le due condizioni non siano diverse dopo 3 mesi di trattamento (1), ma lo diventino dopo 6 mesi (2), e come nella condizione di controllo non vi sia una differenza fra 3 mesi e 6 mesi, mentre nella condizione training sì (Figura 6.6.39). Pairwise Comparisons Measure: MEASURE_1 time 1 2 (I) gruppo Controllo Training Controllo Training (J) gruppo Training Controllo Training Controllo Mean Difference (I-J) -1,091 1,091 6,938* -6,938* Std. Error 1,813 1,813 1,234 1,234 a Sig. ,566 ,566 ,001 ,001 95% Confidence Interval for a Difference Lower Bound Upper Bound -5,377 3,195 -3,195 5,377 4,020 9,857 -9,857 -4,020 Based on estimated marginal means *. The mean difference is significant at the ,05 level. a. Adjustment for multiple comparisons: Bonferroni. Pairwise Comparisons Measure: MEASURE_1 gruppo Controllo Training (I) time 1 2 1 2 (J) time 2 1 2 1 Mean Difference (I-J) ,985 -,985 9,015* -9,015* Std. Error 1,180 1,180 1,180 1,180 a Sig. ,431 ,431 ,000 ,000 95% Confidence Interval for a Difference Lower Bound Upper Bound -1,805 3,775 -3,775 1,805 6,225 11,805 -11,805 -6,225 Based on estimated marginal means *. The mean difference is significant at the ,05 level. a. Adjustment for multiple comparisons: Bonferroni. Figura 6.6.39 Confronti post-hoc per l’effetto di interazione Per riportare il risultato in un articolo scientifico o in una tesi di laurea riporteremo la tabella con le statistiche descrittive, il grafico in Figura 6.6.36 (per mostrare graficamente la disomogeneità iniziale dei due gruppi) e scriveremo: E’ stata eseguita un’analisi della covarianza fattoriale mista 2 × 2 (Tempo [3 mesi, 6 mesi, within] × Conizione [Training, NoTraining, between]) e covariata punteggio alla scala IM all’inizio del trattamento. Un’analisi preliminare, infatti, aveva mostrato che il gruppo Training e il gruppo NoTraining presentavano una disomogeneità rispetto al punteggio di partenza (t(8) = 3,94, p = ,004). Non è risultato significativo l’effetto principale del tempo (F(1, 7) = 0,04, p = ,845, η2 parziale = 0,006), mentre sono risultati significativi gli effetti principali della Condizione (F(1, 7) = 6,26, p = ,041, η2 parziale = 0,472) e della covariata (F(1, 7) = 30,88, p = ,001, η2 parziale = 0,815. E’ risultata inoltre significativa l’interazione Condizione × Tempo (F(1, 7) = 15,51, p = ,006, η2 parziale = 0,689. L’ispezione delle medie ha rivelato che nella condizione Training i punteggi di IM erano inferiori indipendentemente dal tempo e dalla covariata. I confronti post-hoc sull’effetto di interazione, eseguiti con correzione Bonferroni del livello di significatività, hanno mostrato come le due condizioni non siano diverse dopo 3 mesi di trattamento ma lo diventino dopo 6 mesi, e come nella condizione di controllo non vi sia una differenza fra 3 mesi e 6 mesi, mentre nella condizione training la differenza era presente. Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia 6.6.4.1 Assunzioni per l’applicazione dell’analisi della covarianza Per poter essere applicata correttamente, l’ANCOVA prevede alcune assunzioni: 1. I punteggi sulla variabile dipendente y possono essere considerati una combinazione lineare di quattro componenti indipendenti: media generale µ, effetto del fattore α, effetto lineare della covariata β, termine di errore ε: y = µ + α i + β ( X ij − M x ) + ε . In questa equazione β rappresenta la variazione media che ci attendiamo in y per un cambiamento unitario del valore della covariata 2. L’errore ε è distribuito normalmente con media 0 e gli errori di soggetti diversi sono indipendenti fra loro 3. Il coefficiente β della covariata è lo stesso in ogni livello del fattore, altrimenti risulta significativa l’interazione covariata × fattore: questo significa che il β del modello non è lo stesso per tutti i livelli del fattore. 4. La covariata è una variabile matematica fissa misurata senza errore Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia 6.6.5 Analisi multivariata della varianza (MANOVA) per campioni indipendenti Quando le variabili dipendenti sono più di una, è possibile realizzare un test omnibus che in primo luogo verifichi l’ipotesi che la/e variabile/i indipendente/i (siano esse fattori o covariate) abbiano un effetto (effetto multivariato) sulle variabili dipendenti nel loro insieme. L’insieme delle variabili dipendenti costituisce una variata, che è un criterio statistico risultante dalla combinazione lineare delle variabili originariamente osservate. Se per le variabili si fanno ipotesi sulle medie, per le variate si fanno ipotesi sui centroidi. Il test multivariato verifica infatti se i centroidi dei gruppi della/e variabile/i indipendente/i sono uguali fra loro. Se questo test è significativo, si passa a considerare gli effetti della/e variabile/i indipendente/i sulle singole variabili dipendenti, come se si trattasse di un’ANOVA (effetti univariati). Se i test univariati sono significativi, si realizzano i confronti post-hoc per indagare fra le medie di quali gruppi sussistono differenze significative. Le assunzioni che devono essere rispettate per l’applicazione della MANOVA sono identiche a quelle dell’ANOVA per quanto riguarda l’indipendenza delle osservazioni, l’assenza di relazione fra i termini di errore, e l’additività degli effetti nel modello lineare. In più vi sono le seguenti assunzioni: 1. Le correlazioni fra le variabili dipendenti devono essere diverse da zero: il vantaggio della MANOVA rispetto al realizzare tante ANOVA quante sono le variabili dipendenti consiste proprio nel considerare le relazioni fra le variabili dipendenti per valutare l’effetto delle variabili indipendenti 2. Omogeneità delle matrici di varianza/covarianza all’interno di ogni gruppo: il pattern di relazioni fra le variabili dipendenti deve essere lo stesso in ogni gruppo 3. In ogni gruppo vi deve essere un numero di soggetti superiore al numero di variabili dipendenti Se una di queste assunzioni non è soddisfatta, è consigliabile procedere con una serie di ANOVA separate. La MANOVA si rivela particolarmente utile quando le variabili dipendenti possono essere considerate operazionalizzazioni di uno stesso costrutto psicologico. Il fatto di fare riferimento ad un unico costrutto fa sì che le variabili siano adeguatamente correlate fra loro, e permette di verificare sia ipotesi generali, a livello di centroidi, che specifiche, a livello di medie. Può essere il caso delle scale ad un test psicologico, i cui punteggi siano correlati fra loro. Nel caso dell'esempio dell'ANOVA mista la MANOVA non era applicabile perché la domanda di ricerca riguardava anche la differenza fra le varie condizioni definite dalle misure ripetute, che invece non è un obiettivo della MANOVA. Supponiamo però di voler indagare le differenze legate alla caratteristica principale della scelta del cibo (Gusto, Contenuto Calorico, Genuinità) fra i punteggi alle tre scale della Intuitive Eating Scale (IES, Tylka, 2006; adattamento italiano di Chiorri, 2009). La tre scale di IES valutano il fatto che le persone si concedano di mangiare quello che desiderano, senza restrizioni legate a vincoli esterni come la dieta (Permesso), che mangino in risposta a stimoli fisiologici, e non emotivi (Motivo) e che si basino sui segnali interni del proprio corpo per decidere quando iniziare e smettere di mangiare (Segnali). Se le tre scale posseggono validità di criterio, ci aspettiamo che individui che riferiscono di scegliere il cibo in base al gusto, al contenuto calorico e alla genuinità ottengano punteggi diversi sulle tre scale. Sia Tylka (2006) che Chiorri (2009) hanno mostrato in campioni molto ampi come i punteggi delle tre scale siano correlati fra loro, per cui la prima assunzione per l’applicabilità della MANOVA è soddisfatta. Per quanto riguarda l’altra assunzione, quella dell’omogeneità delle matrici di varianza/covarianza all’interno di ogni gruppo, è verificabile mediante SPSS con un apposito test statistico. I dati in Tabella 6.6.7 mostrano inoltre che in ogni gruppo il numero di soggetti è maggiore del numero di variabili dipendenti. Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia Tabella 6.6.7 Punteggi alle scale della Intuitive Eating Scale per tre gruppi di soggetti, distinti in base al criterio per la scelta del cibo Gruppo Permesso Motivo Segnali 1 4,00 4,17 3,83 1 3,33 3,83 4,50 1 4,00 4,33 4,00 1 4,56 3,83 5,00 1 3,56 4,50 4,00 1 4,00 4,00 4,00 2 1,22 2,17 2,00 2 3,22 2,33 2,83 2 3,67 2,17 4,50 2 2,11 1,67 2,50 2 2,44 3,00 3,33 2 2,67 2,83 3,50 3 2,56 2,67 4,00 3 2,89 2,50 3,67 3 3,56 2,00 3,67 3 3,22 4,50 5,00 3 3,44 4,17 3,33 3 2,44 2,83 4,67 Nota: 1 = Gusto; 2 = Contenuto Calorico; 3 = Genuinità Obiettivo: verificare se i punteggi alle tre scale del test IES si differenziano in base al criterio di scelta del cibo Variabili Variabile Indipendente: Criterio di scelta del cibo (nominale, politomica: Gusto, Contenuto Calorico, Genuinità) Variabile Dipendente 1: punteggio alla scala Permesso dello IES (ad intervalli) Variabile Dipendente 2: punteggio alla scala Motivo dello IES (ad intervalli) Variabile Dipendente 3: punteggio alla scala Segnali dello IES (ad intervalli) Ipotesi: potrebbe esservi un effetto della variabile indipendente sulle tre scale nel loro insieme. H0: cGusto = cContenutoCalorico = cGenuinità → i centroidi c delle popolazioni da cui sono stati estratti i gruppi sono uguali → il criterio per la scelta del cibo non influenza, in generale, i punteggi al test IES H1: Almeno due centroidi diversi → i centroidi c delle popolazioni da cui sono stati estratti i gruppi non sono tutti uguali → il criterio per la scelta del cibo influenza, in generale, i punteggi al test IES oppure H0: µGusto,Permesso = µContenutoCalorico,Permesso = µGenuinità,Permesso → le medie alla scala Permesso delle popolazioni da cui sono stati estratti i gruppi sono uguali → il criterio per la scelta del cibo non influenza il punteggio alla scala Permesso µGusto,Motivo = µContenutoCalorico,Motivo = µGenuinità,Motivo → le medie alla scala Motivo delle popolazioni da cui sono stati estratti i gruppi sono uguali → il criterio per la scelta del cibo non influenza il punteggio alla scala Motivo Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia µGusto,Segnali = µContenutoCalorico,Segnali = µGenuinità,Segnali → le medie alla scala Segnali delle popolazioni da cui sono stati estratti i gruppi sono uguali → il criterio per la scelta del cibo non influenza il punteggio alla scala Segnali H1: Almeno per una variabile, c’è almeno un gruppo con una media della popolazione diversa dalle altre → il criterio per la scelta del cibo influenza almeno un punteggio al test IES In SPSS i dati vanno organizzati come in Figura 6.6.40 e la MANOVA può essere realizzata seguendo il percorso Analyze → General Linear Model → Multivariate. Figura 6.6.40 Organizzazione dei dati in SPSS per la realizzazione di una MANOVA La Figura 6.6.41 mostra come vanno riempiti i campi relativi alle variabili dipendenti e indipendenti. Come si può intuire, è possibile inserire più di una variabile indipendente (fattore) e più covariate, in modo da realizzare MANOVA o MANCOVA fattoriali. La logica è la stessa dell’ANOVA. Figura 6.6.41 Impostazioni per la realizzazione di una MANOVA in SPSS La scelta delle opzioni è la stessa degli altri modelli di ANOVA. In questo caso, però, oltre a specificare i test post-hoc, le statistiche descrittive e gli indici di dimensione dell’effetto, nel menu Options è importante spuntare anche Homogeneity Tests, perché questo ci permetterà di ottenere il test M di Box per l’omogeneità delle matrici di varianza/covarianza che, come abbiamo visto, è una delle assunzioni per l’applicabilità della MANOVA e il test di Levine per l’omogeneità delle varianze dei gruppi per ciascuna variabile dipendente. Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia L’ouput di SPSS riporta le caratteristiche dei gruppi nella tabella Between-Subjects Factors (non riportata) e le statistiche descrittive di ogni gruppo, per ogni variabile dipendente, nella tabella Descriptive Statistics (non riportata). Le tre tabelle successive sono le più interessanti perché riportano il test per l’omogeneità delle matrici di varianza/covarianza (Box’s Test of Equality of Covariance Matrices), gli effetti multivariati (Multivariate Tests), e i test per l’omogeneità delle varianze dei gruppi per ciascuna variabile dipendente (Levene’s Test of Equality of Error Variances). (Figura 6.6.42). a Box's Test of Equality of Covariance Matrices Box's M F df1 df2 Sig. 22,432 1,309 12 1090,385 ,207 Tests the null hypothesis that the observed covariance matrices of the dependent variables are equal across groups. a. Design: Intercept+caratteristica Multivariate Testsc Effect Intercept caratteristica Value ,985 ,015 64,145 64,145 ,862 ,260 2,384 2,168 Pillai's Trace Wilks' Lambda Hotelling's Trace Roy's Largest Root Pillai's Trace Wilks' Lambda Hotelling's Trace Roy's Largest Root F Hypothesis df 277,962a 3,000 277,962a 3,000 277,962a 3,000 277,962a 3,000 3,537 6,000 4,173a 6,000 4,768 6,000 10,115b 3,000 Error df 13,000 13,000 13,000 13,000 28,000 26,000 24,000 14,000 Sig. ,000 ,000 ,000 ,000 ,010 ,005 ,002 ,001 Partial Eta Squared ,985 ,985 ,985 ,985 ,431 ,491 ,544 ,684 a. Exact statistic b. The statistic is an upper bound on F that yields a lower bound on the significance level. c. Design: Intercept+caratteristica a Levene's Test of Equality of Error Variances permesso motivo segnali F 1,401 6,188 1,196 df1 df2 2 2 2 15 15 15 Sig. ,277 ,011 ,330 Tests the null hypothesis that the error variance of the dependent variable is equal across groups. a. Design: Intercept+caratteristica Figura 6.6.42 Output di SPSS per una MANOVA Nella prima tabella osserviamo che il test di Box non è significativo, per cui non possiamo rifiutare l’ipotesi nulla che le matrici di varianza/covarianza delle variabili siano omogenee fra i gruppi. L’ultima assunzione da verificare della MANOVA è quindi soddisfatta. Se il test fosse stato significativo, avremmo dovuto condurre tre ANOVA separate, una per variabile dipendente. La tabella successiva mostra il risultato del test sui centroidi, ossia il primo effetto omnibus da considerare. SPSS riporta quattro diverse statistiche (Pillai’s Trace, Wilks’ Lambda, Hotelling’s Trace e Roy’s Largest Root). Il più utilizzato è sicuramente il Wilks’ Lambda, che è utilizzato anche per calcolare l’indice multivariato di dimensione dell’effetto η2 = 1 − λ, dove λ nella Figura 6.6.42 si trova nella colonna Value, accanto al Wilks’ Lambda nel riquadro caratteristica, ed è ,26, per cui η2 = 1 − ,26 = ,8413. Sia Barbaranelli (2006) che Bray e Maxwell (1985), tuttavia, citano Olson 13 Serlin (1982) suggerisce una diversa procedura di calcolo della dimensione dell’effetto: η 2 = Pillai' sTrace PB s Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia (1974, 1976) nel riferire che il Pillai’s Trace dovrebbe essere preferito in caso di sospette violazioni delle assunzioni e di campioni piccoli (come potrebbe essere questo il caso). Ad ogni modo, in questo caso ci troviamo di fronte ad un effetto multivariato significativo, poiché sia il Pillai’s Trace che il Wilks’ Lambda sono significativi (Sig. < ,05 in entrambi i casi). Questo significa che almeno in una variabile dipendente dovremmo trovare un test F significativo. Nell’ultima tabella osserviamo infine come le varianze dei gruppi per la variabile Motivo non siano omogenee, il che suggerirebbe di considerare con attenzione i risultati dei test univariati in questa variabile. La Figura 6.6.43 riporta i risultati dei test univariati (Tests of Between-Subjects Effects), delle medie stimate (Estimates) e dei test post-hoc (Pairwise Comparisons)14. Tests of Between-Subjects Effects Source Corrected Model Intercept caratteristica Error Total Corrected Total Dependent Variable permesso motivo segnali permesso motivo segnali permesso motivo segnali permesso motivo segnali permesso motivo segnali permesso motivo segnali Type III Sum of Squares 5,664a 9,250b 4,309c 179,797 183,681 259,414 5,664 9,250 4,309 5,650 6,486 6,889 191,111 199,417 270,611 11,314 15,736 11,198 df 2 2 2 1 1 1 2 2 2 15 15 15 18 18 18 17 17 17 Mean Square 2,832 4,625 2,154 179,797 183,681 259,414 2,832 4,625 2,154 ,377 ,432 ,459 F 7,518 10,696 4,691 477,320 424,786 564,852 7,518 10,696 4,691 Partial Eta Squared ,501 ,588 ,385 ,970 ,966 ,974 ,501 ,588 ,385 Sig. ,005 ,001 ,026 ,000 ,000 ,000 ,005 ,001 ,026 a. R Squared = ,501 (Adjusted R Squared = ,434) b. R Squared = ,588 (Adjusted R Squared = ,533) c. R Squared = ,385 (Adjusted R Squared = ,303) Estimates Dependent Variable permesso motivo segnali caratteristica Gusto Contenuto calorico Genuinità Gusto Contenuto calorico Genuinità Gusto Contenuto calorico Genuinità Mean 3,907 2,556 3,019 4,111 2,361 3,111 4,222 3,111 4,056 Std. Error ,251 ,251 ,251 ,268 ,268 ,268 ,277 ,277 ,277 95% Confidence Interval Lower Bound Upper Bound 3,373 4,441 2,022 3,090 2,484 3,553 3,539 4,683 1,789 2,933 2,539 3,683 3,633 4,812 2,521 3,701 3,466 4,645 dove s è il valore minore fra il numero di variabili dipendenti e il numero di gruppi meno 1. Nel nostro caso, il numero di variabili dipendenti è 3, il numero di gruppi meno 1 è 3 − 1 = 2, per cui s = 2, da cui η 2 = ,862 =,431 PB 2 Il valore va poi ulteriormente aggiustato mediante la formula ηˆ = 1 − (1 − η ) n − 1 , dove n è il numero totale di n − b − 1 soggetti, e b il valore maggiore fra il numero di gruppi e il numero di variabili. Nel nostro caso, n = 18, e b = 3, in quanto abbiamo tre gruppi e tre variabili, per cui: ηˆ 2 = 1 − (1−,431) 18 − 1 =,31 18 − 3 − 1 2 PB 14 2 PB Sono omesse dall’esposizione le tabelle Multivariate Tests e Univariate Tests per brevità. Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia Pairwise Comparisons Dependent Variable permesso (I) caratteristica Gusto Contenuto calorico Genuinità motivo Gusto Contenuto calorico Genuinità segnali Gusto Contenuto calorico Genuinità (J) caratteristica Contenuto calorico Genuinità Gusto Genuinità Gusto Contenuto calorico Contenuto calorico Genuinità Gusto Genuinità Gusto Contenuto calorico Contenuto calorico Genuinità Gusto Genuinità Gusto Contenuto calorico Mean Difference (I-J) 1,352* ,889 -1,352* -,463 -,889 ,463 1,750* 1,000 -1,750* -,750 -1,000 ,750 1,111* ,167 -1,111* -,944 -,167 ,944 Std. Error ,354 ,354 ,354 ,354 ,354 ,354 ,380 ,380 ,380 ,380 ,380 ,380 ,391 ,391 ,391 ,391 ,391 ,391 a Sig. ,005 ,072 ,005 ,633 ,072 ,633 ,001 ,056 ,001 ,201 ,056 ,201 ,037 1,000 ,037 ,087 1,000 ,087 95% Confidence Interval for a Difference Lower Bound Upper Bound ,397 2,306 -,066 1,843 -2,306 -,397 -1,417 ,492 -1,843 ,066 -,492 1,417 ,727 2,773 -,023 2,023 -2,773 -,727 -1,773 ,273 -2,023 ,023 -,273 1,773 ,057 2,165 -,887 1,221 -2,165 -,057 -1,998 ,110 -1,221 ,887 -,110 1,998 Based on estimated marginal means *. The mean difference is significant at the ,05 level. a. Adjustment for multiple comparisons: Bonferroni. Figura 6.6.43 Output di SPSS per una MANOVA: test univariati e post-hoc La tabella Tests of Between-Subjects Effects mostra come il criterio di scelta del cibo abbia un effetto statisticamente significativo per tutte e tre le variabili dipendenti, anche se una correzione per confronti multipli sul livello di significatività α = ,05 porterebbe il livello di significatività comparisonwise a ,05 / 3 = ,017, il che escluderebbe la significatività nella variabile Segnali. Nella tabella Pairwise Comparisons si nota come in tutte e tre le variabili dipendenti il gruppo che riferisce di basare la scelta del cibo sul Gusto abbia punteggi più alti di chi si basa sul Contenuto Calorico. Alcuni livelli di significatività sono al limite dell’accettabilità, come ad esempio Genuinità vs Gusto in Permesso e in Motivo, o Genuinità vs Contenuto Calorico in Segnali. Considerando la scarsa numerosità dei gruppi, è probabile che questi effetti risultino significativi in campioni anche poco più ampi. Una possibile rappresentazione grafica dei dati è presentata in Figura 6.6.44. Punteggio medio di scala 5 4 3 2 Gusto Contenuto calorico 1 Genuinità 0 Permesso Motivo Segnali Criterio scelta del cibo Figura 6.6.44 Grafico delle medie in base ai risultati di una MANOVA Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia Per riportare il risultato in un articolo scientifico o in una tesi di laurea riporteremo la tabella con le statistiche descrittive, il grafico in Figura 6.6.44 e scriveremo: E’ stata eseguita un’analisi multivariata della varianza con il criterio di scelta del cibo come variabile indipendente (Gusto, Contenuto Calorico, Genuinità) e variabili dipendenti le tre scale della Intuitive Eating Scale (Permesso, Motivo, Segnali). Una volta verificato che le matrici di varianza/covarianza dei gruppi erano omogenee (Box’s M = 22,43, F(12, 1090.39) = 1,309, p = ,207), il test multivariato ha mostrato un effetto statisticamente significativo del fattore (Wilks’ Lambda = ,260, F(6, 26) = 4,173, p = ,005, η2 parziale = ,49). I test univariati hanno evidenziato un effetto statisticamente significativo del fattore su tutte le variabili (Permesso: F(2, 15) = 7,52, p = ,005, η2 parziale = ,50; Motivo: F(2, 15) = 10,70, p = ,001, η2 parziale = ,58; Segnali: F(2, 15) = 4,69, p = ,026, η2 parziale = ,39), e i successivi test post-hoc, eseguiti con correzione Bonferroni del livello di significatività, hanno rivelato come in tutte e tre le variabili dipendenti il gruppo che riferisce di basare la scelta del cibo sul Gusto abbia punteggi più alti di chi si basa sul Contenuto Calorico. Alcuni livelli di significatività sono risultati al limite dell’accettabilità, come ad esempio Genuinità vs Gusto in Permesso e in Motivo, o Genuinità vs Contenuto Calorico in Segnali. Considerando la scarsa numerosità dei gruppi, è probabile che questi effetti risultino significativi in campioni anche poco più ampi. 6.6.6 Analisi multivariata della varianza per misure ripetute (RM-MANOVA) Questo tipo di analisi è detta anche doubly multivariate ("doppiamente multivariata") e si applica in quei casi in cui si ha un insieme di variabili dipendenti che non vogliamo e/o possiamo confrontare fra loro misurate in due o più momenti successivi nel tempo o in condizioni diverse. Ad esempio, potremmo aver realizzato un esperimento di psicologia dove per ogni condizione vengono misurati l'accuratezza (proporzione di risposte corrette) e il tempo di risposta. Di solito i due indici vengono analizzati separatamente, ma grazie alla RM-MANOVA (dove RM sta per Repeated Measures) è possibile analizzarli contemporaneamente. Supponiamo di sottoporre tre gruppi randomizzati di pazienti di un reparto psichiatrico (8 soggetti che assumono uno psicofarmaco il cui principio attivo produce un'azione inibitoria sul sistema nervoso centrale, 8 soggetti che ricevono un placebo e 8 che non ricevono niente) ad una condizione di doppio compito, nella quale devono eseguire un compito primario di guida al simulatore (uguale per tutti) e nel contempo, come compito secondario, rispondere alle domande di un compito verbale (dire il contrario della parola che sentono) o numerico (fare delle addizioni). Le variabili dipendenti che ci interessa misurare sono sia la prestazione al compito di guida (numero di errori) che l'accuratezza delle risposte (proporzione di risposte corrette). In questa situazione abbiamo due variabili dipendenti che non ha senso confrontare fra loro in termini di punteggio medio, ma che vengono misurate in due diverse condizioni ripetute all'interno dei soggetti (compito verbale e numerico). E' quindi un disegno fattoriale misto (la variabile Trattamento è between) in cui, però, le variabili dipendenti sono due. I dati sono riportati in Tabella 6.6.8. 15 Tabella 6.6.8 Accuratezza e numero di errori a compiti secondari di natura verbale e numerica per tre gruppi di soggetti (Farmaco: 0; Placebo: 1; Controllo: 2) 15 I dati dell'accuratezza, che in origine erano proporzioni (P), sono stati trasformati mediante la formula: 360 TP = arcsin P . La trasformata arcoseno TP si ottiene facilmente con Excel mediante la funzione 2π =((360/(2*PI.GRECO()))*ARCSEN(RADQ(P))). Questo tipo di trasformazione è necessario perché la varianza di una proporzione P [ossia sP2 = P(1 − P)/(n − 1)], si ottiene a partire dal valore stesso della proporzione, il che rappresenta Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia Gruppo 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 Verbale ACC ERR 38,06 60 36,27 58 42,13 64 36,27 68 43,28 69 46,72 63 39,23 67 42,71 64 45,57 48 44,65 56 53,74 54 51,02 49 50,96 51 53,02 50 55,20 49 53,66 44 73,22 28 67,42 39 69,28 40 69,79 40 62,74 38 67,08 35 68,69 38 61,37 35 Numerico ACC ERR 28,45 84 30,66 88 29,87 81 36,27 79 35,06 81 31,95 88 35,06 78 39,43 85 42,23 73 39,34 75 48,16 73 45,53 75 48,77 73 47,88 67 48,59 72 49,97 65 58,24 67 51,95 56 52,81 63 56,34 59 53,73 61 50,37 63 53,51 57 61,76 58 Nota: ACC = accuratezza sottoposta a trasformazione arcoseno; ERR = numero di errori Obiettivo: verificare se la prestazione al compito primario e l'accuratezza nelle risposte al compito secondario variano in funzione del tipo di compito secondario e del trattamento ricevuto Variabili Variabile Indipendente 1: Tipo di compito secondario (nominale, dicotomica: Verbale, Numerico; within) Variabile Indipendente 2: Trattamento (nominale, politomica: Farmaco; Placebo, Controllo; between) Variabile Dipendente 1: numero di errori al compito primario (a rapporti) Variabile Dipendente 2: proporzione di risposte corrette al compito secondario (a rapporti) Ipotesi: Effetto principale del tipo di compito secondario una violazione dell'assunzione dell'omogeneità delle varianze fra i soggetti e impedisce l'applicazione di test statistici come l'ANOVA o la regressione. Nel caso di una distribuzione binomiale la trasformazione arcoseno produce valori la cui varianza è indipendente dal valore di P (Hogg e Craig, 1995). Se la proporzione è uguale a zero al posto di P occorre utilizzare il valore P' = 1/4n, dove n è il numero di prove su cui è stata calcolata la proporzione, mentre se P = 1 occorre utilizzare il valore P' = (n − 0,25)/n. Se interessa, una volta ottenuti i risultati sui dati trasformati (ad esempio, 2π × TP , che in Excel può P = sin 360 2 medie), ritornare all'unità di misura iniziale basta utilizzare la formula inversa essere scritta come =SEN((2*PI.GRECO()/360)*valore_TP)^2. Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia H0: cVerbale = cNumerico → indipendentemente dal Trattamento, i centroidi c delle popolazioni da cui sono stati estratti i campioni di osservazioni sui livelli del tipo di compito secondario sono uguali → il tipo di compito secondario non influenza, nel loro insieme, né il numero di errori al compito primario né l'accuratezza delle risposte al compito secondario H1: cVerbale ≠ cNumerico → indipendentemente dal Trattamento, i centroidi c delle popolazioni da cui sono stati estratti i campioni di osservazioni sui livelli del tipo di compito secondario sono diversi → il tipo di compito secondario influenza, nel loro insieme, il numero di errori al compito primario e l'accuratezza delle risposte al compito secondario Effetto principale del Trattamento H0: cFarmaco = cPlacebo = cControllo → indipendentemente dal tipo di compito secondario, i centroidi c delle popolazioni a cui fanno riferimento i campioni definiti dal trattamento non differiscono fra loro → il trattamento non influenza, nel loro insieme, né il numero di errori al compito primario né l'accuratezza delle risposte al compito secondario H1: Almeno due centroidi diversi → indipendentemente dal tipo di compito secondario, almeno due centroidi c delle popolazioni a cui fanno riferimento i campioni definiti dal trattamento differiscono fra loro → il trattamento influenza, nel loro insieme, il numero di errori al compito primario e l'accuratezza delle risposte al compito secondario Effetto di interazione16 H0: (cVerbale − cNumerico)Farmaco = (cVerbale − cNumerico)Placebo = (cVerbale − cNumerico)Controllo → la differenza fra i centroidi c delle popolazioni da cui sono stati estratti i campioni di osservazioni sui livelli del tipo di compito secondario è la stessa per tutti i livelli di trattamento → il trattamento non modifica, in generale, l'effetto del tipo di compito secondario sul numero di errori al compito primario e sull'accuratezza delle risposte al compito secondario H0: Almeno due differenze diverse → la differenza fra i centroidi c delle popolazioni da cui sono stati estratti i campioni di osservazioni sui livelli del tipo di compito secondario non è la stessa per tutti i livelli di trattamento → il trattamento modifica, in generale, l'effetto del tipo di compito secondario sul numero di errori al compito primario e sull'accuratezza delle risposte al compito secondario Per realizzare l'analisi con SPSS occorre impostare i dati come in Figura 6.6.45. Si presti attenzione alla necessità di avere i nomi delle variabili su una sola riga. 16 Era possibile formulare le ipotesi sull'effetto di interazione anche nell'altra direzione, ossia che il tipo di compito secondario modera l'effetto del trattamento. Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia Figura 6.6.45 Organizzazione dei dati in SPSS per la realizzazione di una MANOVA fattoriale mista Il procedimento di fatto è identico a quello per la realizzazione di un'ANOVA fattoriale mista (Analyze→General Linear Model→Repeated Measures, con impostazione del fattori within), a parte il fatto che vanno inseriti tramite il campo Measure Name i nomi delle due variabili dipendenti (Figura 6.6.46). Dopo aver inserito ogni nome occorre clickare su Add per spostarlo nel campo sottostante. Figura 6.6.46 Impostazioni di SPSS per la realizzazione di una MANOVA per misure ripetute Nella finestra successiva ogni variabile deve essere assegnata alla condizione corretta, e non necessariamente le variabili sono nello stesso ordine delle combinazioni delle condizioni, come nel caso della Figura 6.6.47. Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia Figura 6.6.47 Impostazioni di SPSS per la realizzazione di una MANOVA per misure ripetute Clickiamo su Options, in modo da impostare i test post-hoc per gli effetti principali e per l’interazione (anche in questo caso è necessaria la modifica della sintassi di SPSS vista nella sezione 6.6.1)17, richiedere le statistiche descrittive, le dimensioni dell’effetto e i test di omogeneità delle varianze (Figura 6.6.48). Si noti che i test post-hoc per il tipo di compito secondario non sono necessari dato che la variabile è dicotomica. 17 GLM ACC_VER ACC_NUM ERR_VER ERR_NUM BY Trattamento /WSFACTOR = compito 2 Polynomial /MEASURE = acc err /METHOD = SSTYPE(3) /PLOT = PROFILE( Trattamento*compito compito*Trattamento ) /EMMEANS = TABLES(Trattamento) COMPARE ADJ(BONFERRONI) /EMMEANS = TABLES(compito) COMPARE ADJ(BONFERRONI) /EMMEANS = TABLES(Trattamento*compito) COMPARE(Trattamento) ADJ(BONFERRONI) /EMMEANS = TABLES(Trattamento*compito) COMPARE(compito) ADJ(BONFERRONI) /PRINT = DESCRIPTIVE ETASQ HOMOGENEITY /CRITERIA = ALPHA(.05) /WSDESIGN = compito /DESIGN = Trattamento . Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia Figura 6.6.48 Impostazioni delle opzioni per la realizzazione di una MANOVA per misure ripetute Infine, impostiamo i grafici clickando su Plots. In questo caso chiediamo che vengano realizzati entrambi i grafici possibili, ossia quello con le categorie della variabile Trattamento (Horizontal Axis) e le categorie della variabile Tipo di compito secondario rappresentate da linee di colore diverso (Separate Lines), e viceversa. Eseguiamo l'analisi e otteniamo nell'output le tabelle in Figura 6.6.49 e 6.6.50. Within-Subjects Factors Measure acc err compito 1 2 1 2 Between-Subjects Factors Dependent Variable ACC_VER ACC_NUM ERR_VER ERR_NUM Trattamento ,00 1,00 2,00 Value Label Farmaco Placebo Controllo N 8 8 8 Descriptive Statistics ACC_VER ACC_NUM ERR_VER ERR_NUM Trattamento Farmaco Placebo Controllo Total Farmaco Placebo Controllo Total Farmaco Placebo Controllo Total Farmaco Placebo Controllo Total Mean 40,5838 50,9775 67,4488 53,0033 33,3438 46,3088 54,8388 44,8304 64,13 50,13 36,63 50,29 83,00 71,63 60,50 71,71 Std. Deviation 3,72739 3,89338 3,83486 11,87337 3,71593 3,71038 3,72542 9,70106 3,834 3,682 3,998 12,042 3,854 3,662 3,703 10,041 N 8 8 8 24 8 8 8 24 8 8 8 24 8 8 8 24 a Box's Test of Equality of Covariance Matrices Box's M F df1 df2 Sig. 40,129 1,433 20 1582,995 ,097 Tests the null hypothesis that the observed covariance matrices of the dependent variables are equal across groups. a. Design: Intercept+Trattamento Within Subjects Design: compito Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia Multivariate Testsc Effect Between Subjects Intercept Trattamento Within Subjects compito compito * Trattamento Pillai's Trace Wilks' Lambda Hotelling's Trace Roy's Largest Root Pillai's Trace Wilks' Lambda Hotelling's Trace Roy's Largest Root Pillai's Trace Wilks' Lambda Hotelling's Trace Roy's Largest Root Pillai's Trace Wilks' Lambda Hotelling's Trace Roy's Largest Root Value ,999 ,001 1441,409 1441,409 ,975 ,033 29,107 29,099 ,940 ,060 15,583 15,583 ,461 ,568 ,712 ,633 F Hypothesis df 14414,090a 2,000 14414,090a 2,000 14414,090a 2,000 14414,090a 2,000 9,986 4,000 45,087a 4,000 138,260 4,000 305,542b 2,000 155,833a 2,000 155,833a 2,000 155,833a 2,000 155,833a 2,000 3,142 4,000 3,272a 4,000 3,381 4,000 6,646b 2,000 Error df 20,000 20,000 20,000 20,000 42,000 40,000 38,000 21,000 20,000 20,000 20,000 20,000 42,000 40,000 38,000 21,000 Sig. ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,024 ,021 ,018 ,006 Partial Eta Squared ,999 ,999 ,999 ,999 ,487 ,818 ,936 ,967 ,940 ,940 ,940 ,940 ,230 ,247 ,262 ,388 a. Exact statistic b. The statistic is an upper bound on F that yields a lower bound on the significance level. c. Design: Intercept+Trattamento Within Subjects Design: compito Mauchly's Test of Sphericityb Epsilon Within Subjects Effect compito Measure acc err Mauchly's W 1,000 1,000 Approx. Chi-Square ,000 ,000 df Sig. 0 0 . . Greenhous e-Geisser 1,000 1,000 a Huynh-Feldt 1,000 1,000 Lower-bound 1,000 1,000 Tests the null hypothesis that the error covariance matrix of the orthonormalized transformed dependent variables is proportional to an identity matrix. a. May be used to adjust the degrees of freedom for the averaged tests of significance. Corrected tests are displayed in the Tests of Within-Subjects Effects table. b. Design: Intercept+Trattamento Within Subjects Design: compito Tests of within-subjects effects Multivariatec,d Within Subjects Effect compito compito * Trattamento Pillai's Trace Wilks' Lambda Hotelling's Trace Roy's Largest Root Pillai's Trace Wilks' Lambda Hotelling's Trace Roy's Largest Root Value ,940 ,060 15,583 15,583 ,461 ,568 ,712 ,633 F Hypothesis df 155,833a 2,000 155,833a 2,000 155,833a 2,000 155,833a 2,000 3,142 4,000 3,272a 4,000 3,381 4,000 6,646b 2,000 Error df 20,000 20,000 20,000 20,000 42,000 40,000 38,000 21,000 Sig. ,000 ,000 ,000 ,000 ,024 ,021 ,018 ,006 Partial Eta Squared ,940 ,940 ,940 ,940 ,230 ,247 ,262 ,388 a. Exact statistic b. The statistic is an upper bound on F that yields a lower bound on the significance level. c. Design: Intercept+Trattamento Within Subjects Design: compito d. Tests are based on averaged variables. Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia Univariate Tests Source compito Measure acc err compito * Trattamento acc err Error(compito) acc err Sphericity Assumed Greenhouse-Geisser Huynh-Feldt Lower-bound Sphericity Assumed Greenhouse-Geisser Huynh-Feldt Lower-bound Sphericity Assumed Greenhouse-Geisser Huynh-Feldt Lower-bound Sphericity Assumed Greenhouse-Geisser Huynh-Feldt Lower-bound Sphericity Assumed Greenhouse-Geisser Huynh-Feldt Lower-bound Sphericity Assumed Greenhouse-Geisser Huynh-Feldt Lower-bound Type III Sum of Squares 801,559 801,559 801,559 801,559 5504,083 5504,083 5504,083 5504,083 131,349 131,349 131,349 131,349 50,042 50,042 50,042 50,042 209,105 209,105 209,105 209,105 388,875 388,875 388,875 388,875 df 1 1,000 1,000 1,000 1 1,000 1,000 1,000 2 2,000 2,000 2,000 2 2,000 2,000 2,000 21 21,000 21,000 21,000 21 21,000 21,000 21,000 Mean Square 801,559 801,559 801,559 801,559 5504,083 5504,083 5504,083 5504,083 65,674 65,674 65,674 65,674 25,021 25,021 25,021 25,021 9,957 9,957 9,957 9,957 18,518 18,518 18,518 18,518 F 80,499 80,499 80,499 80,499 297,231 297,231 297,231 297,231 6,596 6,596 6,596 6,596 1,351 1,351 1,351 1,351 Sig. ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,006 ,006 ,006 ,006 ,281 ,281 ,281 ,281 Partial Eta Squared ,793 ,793 ,793 ,793 ,934 ,934 ,934 ,934 ,386 ,386 ,386 ,386 ,114 ,114 ,114 ,114 Tests of Within-Subjects Contrasts Source compito compito * Trattamento Error(compito) Measure acc err acc err acc err compito Linear Linear Linear Linear Linear Linear Type III Sum of Squares 801,559 5504,083 131,349 50,042 209,105 388,875 df 1 1 2 2 21 21 Mean Square 801,559 5504,083 65,674 25,021 9,957 18,518 F 80,499 297,231 6,596 1,351 Sig. ,000 ,000 ,006 ,281 Partial Eta Squared ,793 ,934 ,386 ,114 a Levene's Test of Equality of Error Variances F ,048 ,018 ,040 ,109 ACC_VER ACC_NUM ERR_VER ERR_NUM df1 df2 2 2 2 2 21 21 21 21 Sig. ,954 ,982 ,961 ,897 Tests the null hypothesis that the error variance of the dependent variable is equal across groups. a. Design: Intercept+Trattamento Within Subjects Design: compito Tests of Between-Subjects Effects Transformed Variable: Average Source Intercept Trattamento Error Measure acc err acc err acc err Type III Sum of Squares 114857,312 178608,000 4679,178 5000,375 387,378 214,625 df 1 1 2 2 21 21 Mean Square 114857,312 178608,000 2339,589 2500,188 18,447 10,220 F 6226,483 17475,914 126,831 244,631 Sig. ,000 ,000 ,000 ,000 Partial Eta Squared ,997 ,999 ,924 ,959 Figura 6.6.49 Output di SPSS per una MANOVA per misure ripetute Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia Nell'output di Figura 6.6.49 osserviamo subito un'apparente ambiguità. Vi sono due tabelle chiamate Multivariate Tests, che peraltro contengono dati che in questo caso sono identici per gli effetti del fattore within. Si noti che non sempre questo è il caso, soprattutto se non si hanno fattori between ma solo fattori within. Per questo motivo è bene comprendere che differenza c'è. La prima di queste tabelle contiene test completamente (o doppiamente) multivariati, mentre la seconda contiene test in media (o singolarmente) multivariati, come indicato nella nota (Tests are based on averaged variables). In generale è consigliabile consultare la prima tabella, perché è quella che contiene tutti gli effetti contemporaneamente − nella seconda non sono presenti gli effetti between − per cui ci concentreremo solo su questa. Ma andiamo con ordine. Le tabella Within-Subjects Factors e Between-Subjects Factors riassumono il disegno della ricerca, mentre la tabella Descriptive Statistics fornisce medie e deviazioni standard per ogni gruppo in ogni condizione per ogni variabile dipendente. La tabella Box's Test of Equality of Covariance Matrices è di fondamentale importanza in quanto, come abbiamo visto, ci permette di appurare se l'assunzione per l'applicazione della MANOVA che le matrici di varianza/covarianza delle variabili dipendenti siano omogenee nei gruppi definiti dalla variabile between. In questo caso l'assunzione è soddisfatta (Sig. = ,097 > ,05). Nella tabella Multivariate Tests osserviamo che tutti gli effetti principali dei fattori e la loro interazione sono statisticamente significativi, sia se consideriamo il Pillai's Trace, sia se consideriamo il Wilks' Lambda. Questo vuol dire che andremo ad indagare per ognuna delle variabili dipendenti l'effetto univariato dei fattori. La tabella Mauchly's Test of Sphericity in questo caso non ci fornisce informazioni utili, in quanto il test di Mauchly può essere applicato solo quando si hanno almeno tre condizioni within, e noi ne abbiamo due (tipo di compito secondario). Ignoriamo, come spiegato in precedenza, la seconda tabella Multivariate, e osserviamo la tabella Univariate Tests, che ci mostra che l'effetto principale del tipo di compito è statisticamente significativo sia per l'accuratezza, sia per il numero di errori, mentre l'interazione Compito × Trattamento è significativa solo per l'accuratezza. Anche la tabella Tests of Within-Subjects Contrasts è poco informativa nel nostro caso, dato che, avendo il fattore within solo due livelli, è possibile verificare solo l'ipotesi di linearità. Dalla tabella Levene's Test of Equality of Error Variances comincia la parte di output relativa al fattore between, ossia il Trattamento. Questa tabella ci mostra come l'assunzione di omogeneità della varianza fra i gruppi sia soddisfatta in tutte le condizioni per tutte le variabili (Sig. > ,05). La tabella successiva Tests of Between-Subjects Effects ci informa che l'effetto del Trattamento è significativo per entrambe le variabili dipendenti, per cui esamineremo i risultati dei test post-hoc per entrambe. I test post-hoc sono riportati in Figura 6.6.50. 1. Trattamento Estimates Measure acc err Trattamento Farmaco Placebo Controllo Farmaco Placebo Controllo Mean 36,964 48,643 61,144 73,563 60,875 48,563 Std. Error 1,074 1,074 1,074 ,799 ,799 ,799 95% Confidence Interval Lower Bound Upper Bound 34,731 39,197 46,410 50,876 58,911 63,377 71,900 75,225 59,213 62,537 46,900 50,225 Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia Pairwise Comparisons Measure acc (I) Trattamento Farmaco Placebo Controllo err Farmaco Placebo Controllo (J) Trattamento Placebo Controllo Farmaco Controllo Farmaco Placebo Placebo Controllo Farmaco Controllo Farmaco Placebo Mean Difference (I-J) Std. Error -11,679* 1,518 -24,180* 1,518 11,679* 1,518 -12,501* 1,518 24,180* 1,518 12,501* 1,518 12,688* 1,130 25,000* 1,130 -12,688* 1,130 12,313* 1,130 -25,000* 1,130 -12,313* 1,130 a Sig. ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 95% Confidence Interval for a Difference Lower Bound Upper Bound -15,630 -7,729 -28,130 -20,230 7,729 15,630 -16,451 -8,550 20,230 28,130 8,550 16,451 9,747 15,628 22,060 27,940 -15,628 -9,747 9,372 15,253 -27,940 -22,060 -15,253 -9,372 Based on estimated marginal means *. The mean difference is significant at the ,05 level. a. Adjustment for multiple comparisons: Bonferroni. 2. Compito Estimates Measure acc err compito 1 2 1 2 Mean 53,003 44,830 50,292 71,708 95% Confidence Interval Lower Bound Upper Bound 51,382 54,625 43,252 46,408 48,662 51,922 70,120 73,296 Std. Error ,780 ,759 ,784 ,764 Pairwise Comparisons Measure acc err (I) compito 1 2 1 2 Mean Difference (I-J) 8,173* -8,173* -21,417* 21,417* (J) compito 2 1 2 1 Std. Error ,911 ,911 1,242 1,242 a Sig. ,000 ,000 ,000 ,000 95% Confidence Interval for a Difference Lower Bound Upper Bound 6,279 10,067 -10,067 -6,279 -24,000 -18,833 18,833 24,000 Based on estimated marginal means *. The mean difference is significant at the ,05 level. a. Adjustment for multiple comparisons: Bonferroni. 3. Trattamento*compito Estimates Measure acc Trattamento Farmaco Placebo Controllo err Farmaco Placebo Controllo compito 1 2 1 2 1 2 1 2 1 2 1 2 Mean 40,584 33,344 50,978 46,309 67,449 54,839 64,125 83,000 50,125 71,625 36,625 60,500 Std. Error 1,350 1,314 1,350 1,314 1,350 1,314 1,358 1,323 1,358 1,323 1,358 1,323 95% Confidence Interval Lower Bound Upper Bound 37,776 43,392 30,611 36,077 48,169 53,786 43,576 49,042 64,641 70,257 52,106 57,572 61,302 66,948 80,250 85,750 47,302 52,948 68,875 74,375 33,802 39,448 57,750 63,250 Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia Pairwise Comparisons Measure acc compito 1 (I) Trattamento Farmaco Placebo Controllo 2 Farmaco Placebo Controllo err 1 Farmaco Placebo Controllo 2 Farmaco Placebo Controllo (J) Trattamento Placebo Controllo Farmaco Controllo Farmaco Placebo Placebo Controllo Farmaco Controllo Farmaco Placebo Placebo Controllo Farmaco Controllo Farmaco Placebo Placebo Controllo Farmaco Controllo Farmaco Placebo Mean Difference (I-J) -10,394* -26,865* 10,394* -16,471* 26,865* 16,471* -12,965* -21,495* 12,965* -8,530* 21,495* 8,530* 14,000* 27,500* -14,000* 13,500* -27,500* -13,500* 11,375* 22,500* -11,375* 11,125* -22,500* -11,125* Std. Error 1,910 1,910 1,910 1,910 1,910 1,910 1,859 1,859 1,859 1,859 1,859 1,859 1,920 1,920 1,920 1,920 1,920 1,920 1,870 1,870 1,870 1,870 1,870 1,870 a Sig. ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 95% Confidence Interval for a Difference Lower Bound Upper Bound -15,361 -5,426 -31,832 -21,898 5,426 15,361 -21,439 -11,504 21,898 31,832 11,504 21,439 -17,800 -8,130 -26,330 -16,660 8,130 17,800 -13,365 -3,695 16,660 26,330 3,695 13,365 9,006 18,994 22,506 32,494 -18,994 -9,006 8,506 18,494 -32,494 -22,506 -18,494 -8,506 6,509 16,241 17,634 27,366 -16,241 -6,509 6,259 15,991 -27,366 -17,634 -15,991 -6,259 Based on estimated marginal means *. The mean difference is significant at the ,05 level. a. Adjustment for multiple comparisons: Bonferroni. Estimates Measure acc Trattamento Farmaco Placebo Controllo err Farmaco Placebo Controllo compito 1 2 1 2 1 2 1 2 1 2 1 2 Mean 40,584 33,344 50,978 46,309 67,449 54,839 64,125 83,000 50,125 71,625 36,625 60,500 Std. Error 1,350 1,314 1,350 1,314 1,350 1,314 1,358 1,323 1,358 1,323 1,358 1,323 95% Confidence Interval Lower Bound Upper Bound 37,776 43,392 30,611 36,077 48,169 53,786 43,576 49,042 64,641 70,257 52,106 57,572 61,302 66,948 80,250 85,750 47,302 52,948 68,875 74,375 33,802 39,448 57,750 63,250 Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia Pairwise Comparisons Measure acc Trattamento Farmaco Placebo Controllo err Farmaco Placebo Controllo (I) compito 1 2 1 2 1 2 1 2 1 2 1 2 (J) compito 2 1 2 1 2 1 2 1 2 1 2 1 Mean Difference Std. Error (I-J) 7,240* 1,578 -7,240* 1,578 4,669* 1,578 -4,669* 1,578 12,610* 1,578 -12,610* 1,578 -18,875* 2,152 18,875* 2,152 -21,500* 2,152 21,500* 2,152 -23,875* 2,152 23,875* 2,152 a Sig. ,000 ,000 ,007 ,007 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 95% Confidence Interval for a Difference Lower Bound Upper Bound 3,959 10,521 -10,521 -3,959 1,388 7,950 -7,950 -1,388 9,329 15,891 -15,891 -9,329 -23,350 -14,400 14,400 23,350 -25,975 -17,025 17,025 25,975 -28,350 -19,400 19,400 28,350 Based on estimated marginal means *. The mean difference is significant at the ,05 level. a. Adjustment for multiple comparisons: Bonferroni. Figura 6.6.50 Output di SPSS per i test post-hoc di una MANOVA mista 18 La prima parte della Figura 6.6.50 mostra le medie stimate (Estimates) e i test post-hoc (Pairwise Comparisons) per l'effetto principale del compito. Quello che notiamo in questo caso è che, indipendentemente dal tipo di compito secondario, tutti i confronti sono statisticamente significativi. In particolare, osserviamo che il gruppo Controllo ha un'accuratezza media nel compito secondario superiore al gruppo Placebo, che a sua volta ha un'accuratezza media superiore al gruppo Farmaco. Nel caso degli errori al compito primario, il gruppo Controllo ha un numero medio di errori inferiore al gruppo Placebo, che a sua volta ha un numero medio di errori inferiore al gruppo Farmaco. Questi dati, quindi, suggeriscono che chi non prende il farmaco con azione inibitoria sul sistema nervoso centrale ha una maggiore accuratezza nel compito secondario e un minor numero di errori nel compito primario. In qualche modo è un risultato che non ci sorprende, dato che il farmaco potrebbe effettivamente impoverire le capacità di mantenere ad un livello attentivo adeguato. Come detto, per il fattore Tipo di compito secondario i test post-hoc non sono necessari, dato che abbiamo solo due categorie. Ad ogni modo, la tabella Pairwise Comparisons mostra come, indipendentemente dal Trattamento, nella condizione 1 (compito secondario verbale) i soggetti siano più accurati nelle risposte al compito secondario e commettano meno errori nel compito primario. Questo risultato mostra che il compito secondario di tipo numerico (sommare i numeri che vengono comunicati) è più difficile e impegnativo di quello verbale (dire il contrario della parola che viene proposta). Nel caso dei test post-hoc per l'effetto di interazione abbiamo come sempre una doppia prospettiva: le differenze fra le condizioni di compito secondario su ogni livello del trattamento, e le differenze fra i livelli di trattamento su ogni livello della condizione di compito. Nel primo caso osserviamo che sia per l'accuratezza al compito secondario che per il numero di errori al compito primario il pattern di risultati osservato per l'effetto principale del Trattamento è riprodotto sia per la condizione 1 (compito secondario verbale) che per la condizione 2 (compito secondario numerico). Nel secondo caso, allo stesso modo, troviamo che sia l'accuratezza al compito secondario che il Nel primo caso osserviamo che sia per l'accuratezza al compito secondario che per il numero di errori al 18 Per non appesantire l'esposizione sono state omesse le tabelle Multivariate Tests e Univariate Tests Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia compito primario il pattern di risultati osservato per l'effetto principale del Tipo di compito secondario è riprodotto in tutti i livelli di Trattamento. Questo risultato appare contraddittorio con quanto osservato precedentemente, ossia che l'effetto di interazione, a livello univariato, era significativo solo per l'accuratezza al compito secondario. E' una situazione apparentemente paradossale ma che può capitare quando l'effetto non è abbastanza forte per emergere a livello di test omnibus ma che, per il modo particolare che ha il software di eseguire i confronti post-hoc sulle medie marginali stimate, può emergere a livello di confronti a coppie. L'ouput offre anche i grafici di interazione per le due variabili (Figura 6.6.51). Accuratezza Errori Figura 6.6.51 Grafici di interazione per le variabili dipendenti di una MANOVA fattoriale mista In una tesi o in un articolo scientifico riporteremmo le tabelle con le statistiche descrittive, un grafico per ogni variabile dipendente fra quelli illustrati in Figura 6.6.51 e scriveremmo: E' stata condotta un'analisi multivariata della varianza fattoriale mista [oppure: è stata condotta un'analisi doppiamente multivariata] per valutare se soggetti psichiatrici in diverse condizioni di trattamento con un farmaco ad azione inibitoria sul sistema nervoso centrale (Farmaco, Placebo, Controllo) differivano rispetto al numero di errori in un compito primario di guida al simulatore e rispetto all'accuratezza in un compito secondario, e se il diverso tipo di compito secondario (Verbale: rispondere alla parola proposta col suo contrario; Numerico: riferire la somma delle ultime due cifre di una Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia serie presentata uditivamente) poteva giocare a sua volta un ruolo, sia come effetto principale che in interazione con il trattamento. A livello multivariato tutti gli effetti sono risultati statisticamente significativi (Trattamento: Wilks' Lambda = ,033, F(4, 40) = 45,09, p < ,001, η2 parziale = ,82; Compito: Wilks' Lambda = ,060, F(2, 20) = 155,83, p < ,001, η2 parziale = ,94; Compito × Trattamento: Wilks' Lambda = ,568, F(4, 40) = 3,27, p = ,021; η2 parziale = ,25). Le successive analisi della varianza univariate hanno mostrato che il gruppo di Controllo aveva una maggiore accuratezza nelle risposte al compito secondario e produceva un minor numero di errori nel compito primario sia rispetto al gruppo Placebo che al gruppo Farmaco, e che, a sua volta, il gruppo Placebo era più accurato nel compito secondario e commetteva meno errori nel compito primario del gruppo Farmaco. I risultati di questo studio suggeriscono che il farmaco abbia un effetto di peggioramento della prestazione in compiti che richiedono attenzione sostenuta. Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia