Analisi della varianza Analisi della varianza L’analisi della varianza (ANOVA, ANalysis Of VAriance) è una tecnica di analisi dei dati che consente di verificare ipotesi relative a differenze tra le medie di due o più popolazioni. L’analisi della varianza è una tecnica statistica di tipo parametrico: • si assume che la variabile di interesse si distribuisca normalmente nella popolazione e che i due campioni siano estratti in maniera casuale dalla popolazione; • la numerosità campionaria è rilevante • nel confronto tra più campioni le varianze devono essere omogenee. Analisi della varianza È possibile classificare i diversi modelli di ANOVA in base al numero di variabili indipendenti e dipendenti: • i modelli che prevedono una sola variabile indipendente vengono definiti disegni a una via; • i modelli che prevedono due o più variabili indipendenti vengono definiti disegni fattoriali; • i modelli che prevedono una sola variabile dipendente definiscono un’analisi della varianza univariata; • i modelli che prevedono due o più variabili dipendenti definiscono un’analisi della varianza multivariata (o MANOVA, Multivariate Analysis of Variance) Analisi della varianza univariata: disegni “tra soggetti” ad un solo fattore Vengono definiti “tra soggetti”, oppure per gruppi indipendenti, i disegni in cui ad ogni trattamento o condizione sperimentale corrisponde un diverso gruppo di soggetti. In ogni condizione ci sono soggetti diversi: un soggetto esposto ad una condizione non viene esposto a nessun’altra condizione. A B S1 S11 S2 S12 … … S10 Sn Il modello teorico dell’ANOVA Nel modello teorico dell’ANOVA “tra i soggetti” il punteggio yij di un soggetto j nel gruppo i è così scomponibile: yij = µ + αi + εij Dove: µ è la media generale dei punteggi sul campione totale; αi è l’effetto dovuto al trattamento (livello i della variabile indipendente), ed è costante all’interno del trattamento; εij è una componente “residua”, o di errore causale, specifica per ogni soggetto Il modello teorico dell’ANOVA SCOMPOSIZIONE DELLA DEVIANZA La devianza rappresenta la somma dei quadrati degli scostamenti tra ogni punteggio e la media. I diversi tipi di devianza: • devianza totale (SST): è la somma dei quadrati (sum of squares) degli scarti (differenza tra i singoli punteggi e la media generale della variabile); • devianza tra i gruppi (o between, SSB): è la somma dei quadrati degli scarti (differenza tra i punteggi medi di gruppo e la media generale), ovvero la variabilità tra i diversi gruppi; • devianza entro i gruppi (o within, SSW): è la somma dei quadrati degli scarti tra i punteggi di ogni soggetto e la relativa media di gruppo, ovvero alla variabilità dei soggetti all’interno di ogni gruppo. Il modello teorico dell’ANOVA GRADI DI LIBERTA’ E VARIANZE Gradi di libertà (gdl) per ognuna delle componenti della variabilità: 2 ( y − y ) ∑ i ∑ j ij .. , n–1 gdl (il gdl perso è quello • devianza totale (SST): della media totale); • devianza tra i gruppi (o between, SSB): perso è quello della media totale); 2 ( y − y ) ∑ i ∑ j i .. • devianza entro i gruppi (o within, SSW): perde un gdl per ogni media di gruppo). ∑∑ i , k–1 gdl (il gdl 2 ( y − y ) ij i. j , n–k gdl (si Dividendo le devianze per i rispettivi gradi di libertà si ottengono le varianze: • Varianza totale (MST) = devianza totale / n–1; • Varianza tra i gruppi (MSB) = devianza tra i gruppi / k–1; • Varianza entro i gruppi (MSW) = devianza entro i gruppi / n–k. Il modello teorico dell’ANOVA IL RAPPORTO «F» Il rapporto tra le varianze MSB / MSW segue la distribuzione F, quindi può essere utilizzato per esaminare ipotesi sulla significatività della differenza tra la variabilità dovuta al trattamento e quella residua La F esamina le seguenti ipotesi: H0: µ1 = µ2 = … = µk H1: almeno due µ diverse Il modello teorico dell’ANOVA ASSUNZIONI Ci sono delle assunzioni che devono essere soddisfatte affinché i risultati dell’ANOVA possano essere interpretati in maniera affidabile: • gli errori (εij) devono seguire la distribuzione normale ed avere media uguale a 0; • la varianza degli errori (σε) deve essere uguale in ogni gruppo (condizione di omoschedasticità); • gli errori (εij) devono essere indipendenti; • gli effetti hanno una natura additiva: la variabile sperimentale «aggiunge» qualcosa alla condizione-base e lo fa in maniera «identica» per tutti i soggetti. Analisi della varianza univariata: disegni fattoriali Vengono definiti fattoriali (o più vie) i disegni di analisi della varianza in cui vi sono due o più variabili indipendenti. Nei disegni fattoriali vengono esaminati gli effetti di due o più variabili indipendenti sulla variabile dipendente. Il più semplice disegno è il «2 x 2», dove abbiamo due fattori ciascuno dei quali ha due differenti livelli. Vantaggi dei disegni fattoriali: • consentono lo studio dell’interazione. Cioè l’effetto congiunto delle VI sulla VD • aumentano la potenza del test, cioè la probabilità di rilevare la presenza di un effetto, quindi la probabilità di rifiutare l’ipotesi nulla quando essa è falsa • consentono una maggiore economia nel numero dei soggetti da esaminare, mantenendo la stessa potenza del test. Analisi della varianza univariata: disegni fattoriali EFFETTI PRINCIPALI E INTERAZIONI Nei disegni fattoriali abbiamo due tipi di effetti: gli effetti principali e le interazioni. L’effetto principale rappresenta l’effetto medio di una variabile indipendente sulla variabile dipendente, indipendentemente dai valori delle altre variabili indipendenti. L’interazione rappresenta l’effetto di una variabile indipendente sulla variabile dipendente non è lo stesso per tutti i livelli delle altre variabili indipendenti. Analisi della varianza univariata: disegni fattoriali DISEGNI FATTORIALI «TRA SOGGETTI» (BETWEEN SUBJECTS) Nei disegni fattoriali «tra i soggetti» tutti i fattori sono fattori between subjects, ovvero i soggetti vengono assegnati ad ognuna delle singole celle, quindi ogni soggetto è esposto solamente ad una particolare combinazione delle condizioni sperimentali. A1 A2 B1 S1 S2 … S6 S7 … B2 S11 S12 … S16 S17 … Analisi della varianza univariata: disegni “entro i soggetti” ad un solo fattore I disegni entro i soggetti (o within subjects) sono disegni in cui si utilizzano gli stessi soggetti nelle diverse condizioni sperimentali. Nel caso di disegni entro i soggetti l’analisi della varianza viene anche detta per prove (o misure) ripetute. A B S1 S1 S2 S2 … … Sn Sn Analisi della varianza univariata: disegni “entro i soggetti” ad un solo fattore SCOMPOSIZIONE DELLA DEVIANZA TOTALE 2 ( y − y ) ∑ i ∑ j ij .. , [nk–1 gdl]; 2 • devianza tra le prove (SSk): ∑ i ∑ j ( y. j − y.. ) , [k–1 gdl]; • devianza totale (SST): 2 ( y − y ) ∑ i ∑ j 2 ij . j , [k(n–1) gdl] • devianza tra i soggetti (SSS): ∑ i ∑ j ( yi. − y.. ) , [n–1 gdl]; • devianza entro i gruppi (o within, SSW): • devianza residua (SSres): SSW – SSs , [(n–1)(k–1) gdl]; Analisi della varianza univariata: disegni “entro i soggetti” ad un solo fattore ASSUNZIONI Ci sono delle assunzioni che devono essere soddisfatte affinché i risultati possano essere interpretati in maniera affidabile: • gli errori (εij) devono essere indipendenti; • gli errori (εij) devono seguire la distribuzione normale ed avere media uguale a 0; • la varianza delle differenze tra tutte le coppie delle misure ripetute deve essere uguale (sfericità o circolarità); •gli effetti hanno una natura additiva: la variabile sperimentale «aggiunge» qualcosa alla condizione-base e lo fa in maniera «identica» per tutti i soggetti. Analisi della varianza disegni fattoriali «Misti» Nei disegni fattoriali «misti», almeno un fattore è tra i soggetti ed almeno un fattore è entro i soggetti. I soggetti vengono esposti a tutte le condizioni sperimentali della variabile entro, e soltanto ad un livello della variabile tra. A1 A2 B1 S1 S2 … S1 S2 … B2 S6 S7 … S6 S7 … Analisi della varianza - Le variabili - La o le variabili dipendenti sono di tipo quantitativo (scala intervalli o rapporto). Le variabili indipendenti possono essere di due tipi: • categoriale o qualitativo a loro volta distinte in variabili: - tra soggetti o fattori beetween - entro soggetti o fattori within • quantitativo note anche come covariate. Analisi della varianza Univariata OBIETTIVO ANALISI DELLA VARIANZA UNIVARIATA BETWEEN Il caso più semplice di analisi della varianza univariata è il t-test per campioni indipendenti. In quel caso l’obiettivo è quello di confrontare, per una fissata variabile dipendente, le medie di due gruppi indipendenti di soggetti (fattore between a 2 livelli). L’analisi della varianza univariata può essere vista come un’estensione del t-test per campioni indipendenti nei casi in cui: - il fattore between ha più di due livelli (aov a una via); - esiste più di un fattore between (aov a due o più vie, o aov fattoriale). Analisi della varianza Univariata ESEMPI DI APPLICAZIONE AOV AD UNA VIA Si supponga di aver somministrato un test di logica ad un campione di soggetti provenienti da tre tipi differenti di scuole superiori (liceo classico, liceo scientifico, liceo artistico); e di voler valutare se esiste un effetto “scuola di provenienza” sul numero di risposte corrette al test. Il modello da adottare sarà quello di analisi della varianza ad una via con: variabile dipendente: il numero di risposte corrette al test variablie indipendente un fattore beetween a 3 livelli: scuola di provenienza (classico, scientifico, artistico) Analisi della varianza Univariata ESEMPI DI APPLICAZIONE AOV FATTORIALE Riprendendo l’esempio precedente si supponga di disporre anche della classe di provenienza dei soggetti, e di voler valutare i seguenti aspetti: • Complessivamente i soggetti rispondono in maniera diversa a seconda della scuola di provenienza? • Complessivamente i soggetti rispondo in maniera diversa a seconda della classe frequentata? • Esiste un interazione tra il tipo di scuola di provenienza e la classe frequentata? (le differenze tra i tipi di scuola sono costanti per ogni livello di classe frequentata? ) Il modello da adattare ai dati sarà di analisi della varianza 3x5 con: variabile dipendente: il numero di risposte corrette; un fattore between a 3 livelli: “scuola di provenienza” (classico, scientifico, artistico); un fattore between a 5 livelli: “classe” (Ia, IIa, IIIa, IVa, Va) Analisi della varianza Univariata ASSUNZIONI • Le osservazioni seguono una distribuzione normale sulla variabile dipendente in ciascun gruppo. • Le varianze dei gruppi sono uguali (omogenietà della varianza). • Le osservazioni sono indipendenti. Analisi della varianza Univariata ad una via L’APPROCCIO STATISTICO LA FORMULAZIONE DEL PROBLEMA H0 µ1 = µ2 = µ3 = ….. = µk H1 almeno una media è diversa dalle altre Nota: K è il numero di livelli del fattore between Analisi della varianza Univariata ad una via L’APPROCCIO STATISTICO LA SCOMPOSIZIONE DELLA DEVIANZA Devianza totale (N-1) Devianza tra i gruppi (k-1) Nota: N è il numero di oservazioni K è il numero di livelli del fattore between Devianza entro i gruppi (N-k) Analisi della varianza Univariata ad una via L’APPROCCIO STATISTICO IL RAPPORTO: (VARIANZA TRA SOGG.) / (VARIANZA ENTRO SOGG.) Dividendo le devianze (SS) per i rispettivi gradi di libertà si ottengono le varianze (MS). Sotto H0 il rapporto tra le varianze ha una distribuzione nota: F Oss MSTra = ≈ F ( dfTra , df Entro ) MS Entro Se la probabilità associata (p-value) al valore di F osservato è minore di un valore critico fissato a priori (ad esempio 0.05), si rifiuta H0. In questo caso si può conludere che il fattore between, ha un effetto statisticamente significativo sulla variabile dipendente. Analisi della varianza Univariata ad una via L’ANALISI POST-HOC Se l’analisi della varianza è risultata significativa, si potrebbe essere interessati a capire quali tra le medie dei livelli del fattore between differiscono tra loro. La tentazione potrebbe essere quella di applicare una serie di t-test per confrontare tutte le medie tra loro. ERRORE Analisi della varianza Univariata ad una via L’ANALISI POST-HOC Infatti, aumentando il numero di test effettuati, aumenta la probabilità di errore di I° tipo: se testiamo un’ipotesi nulla che in effetti è vera, utilizzando α come valore critico, la probabilità di ottenere un risultato non significativo (corretto) è 1-α; se testiamo 2 ipotesi indipendenti la probabilità che nessuno dei 2 test sia significativo è data, per un teorema del calcolo delle probabilità, dal prodotto delle probabilità (1-α)*(1-α); più generalmente se testiamo K ipotesi indipendenti la probabilità che i test siano congiuntamente non significativi è data da (1-α)K; ne consegue che la probabilità di avere almeno un test significativo sarà 1-(1-α)K. Esemplificando, se vengono testate 20 ipotesi indipendenti al livello di significatività α = 0,05, la probabilità che nessuna sia significativa è 0,9520 = 0,36. La probabilità che almeno una sia significativa per errore sarà 1-(1-0,05)20 = 0,64, ben superiore al valore nominale prescelto del 5%. Analisi della varianza Univariata ad una via L’ANALISI POST-HOC Per “mantenere sotto controllo” la probabilità di errore globale esistono delle tecniche dette di “analisi post-hoc” che mirano a correggere la probabilità di errore dei singoli confronti tra le medie, in modo da ottenere dei risultati statisticamente corretti. Analisi della varianza Univariata I PASSI FONDAMENTALI 1. Identificazione della variabile dipendente e del fattore between (o dei fattori between). 2. Definizione del modello di analisi. 3. Analisi descrittiva dei dati. 4. Verifica delle assunzioni teoriche. 5. Adattamento del modello ai dati. 6. Verifica della significatività degli effetti. 7. Eventuale analisi post-hoc Analisi della varianza Univariata ad una via in SPSS 1. Selezionare il menù “Analizza”. 2. Selezionare l’opzione “Confronta Medie”. 3. Selezionare l’opzione “Anova Univariata”. 4. Selezionare la variabili dipendente e il fattore between. 5. Selezionare l’opzione “opzioni” per statistiche descrittive e test dell’omogeneità delle varianza fra i gruppi. 6. Nel caso di analisi post-hoc, selezionare l’opzione “Post-Hoc” e la/le tecnica/che di analisi post-hoc desiderata/e. 7. Cliccare OK! Analisi della varianza Univariata fattoriale in SPSS 1. Selezionare il menù “Analizza”. 2. Selezionare l’opzione “Modello Lineare Generalizzato”. 3. Selezionare l’opzione “Univariata”. 4. Selezionare la variabile dipendente, i fattori between e le eventuali variabili indipendenti covariate. 5. Selezionare l’opzione “opzioni” per statistiche descrittive e test dell’omogeneità delle varianza fra i gruppi. 6. Nel caso di analisi post-hoc, selezionare l’opzione “Post-Hoc” e la/le tecnica/che di analisi post-hoc desiderata/e. 7. Cliccare OK! Analisi della varianza Univariata ad una via ESEMPIO PRATICO (I) Si supponga di aver somministrato un test sulla memoria ad un campione di soggetti appartenenti a tre fasce d’età (20-29 anni, 30-49 anni, 50 anni e oltre). Si vuole valutare se l’età ha un effetto sulla memoria. Nota: i dati sono contenuti nel file “memoria.sav” Analisi della varianza Univariata ad una via IL MODELLO DI ANALISI Per valutare l’effetto dell’età sulla memoria si adotterà un modello di analisi della varianza univariata ad una via con: • variabili dipendente: il numero di risposte corrette al test • un fattore tra soggetti a 3 livelli: Età (20-29 anni, 30-49 anni, 50 e oltre) Analisi della varianza Univariata ad una via ANALISI DESCRITTIVA DEI DATI Analisi della varianza Univariata ad una via VERIFICA DELL’IPOTESI DI NORMALITA’ Analisi della varianza Univariata ad una via VERIFICA DELL’IPOTESI DI OMOGENEITA’ DELLE VARIANZE Test di omogeneità delle varianze numero di rispote corrette Statistica di Levene 1.407 df1 df2 2 42 Sig. .256 Osservando il valore di significatività del test di Levene si può concludere che le varianze dei tre gruppi di soggetti sono omogenee. Analisi della varianza Univariata ad una via I RISULTATI DELL’ANALISI DELLA VARIANZA ANOVA univariata numero di rispote corrette Fra gruppi Entro gruppi Totale Somma dei quadrati 1086.711 5093.200 6179.911 df 2 42 44 Media dei quadrati 543.356 121.267 F 4.481 Sig. .017 Osservando il valore di significatività (p-value) del test F si può concludere che l’età ha un effetto significativo sulla memoria. Analisi della varianza Univariata ad una via I RISULTATI DEL POST-HOC Confronti multipli Variabile dipendente: numero di rispote corrette Bonferroni (I) età 20-29 anni 30-49 anni 50 anni e oltre (J) età 30-49 anni 50 anni e oltre 20-29 anni 50 anni e oltre 20-29 anni 30-49 anni Differenza fra medie (I-J) 3.26667 11.66667* -3.26667 8.40000 -11.66667* -8.40000 Errore std. 4.02106 4.02106 4.02106 4.02106 4.02106 4.02106 Sig. 1.000 .018 1.000 .128 .018 .128 Intervallo di confidenza 95% Limite Limite inferiore superiore -6.7605 13.2938 1.6395 21.6938 -13.2938 6.7605 -1.6272 18.4272 -21.6938 -1.6395 -18.4272 1.6272 *. La differenza tra le medie è significativa al livello .05. Dall’analisi post-hoc con il metodo di Bonferroni emerge che l’unica differenza significativa è quella tra la prima e la terza fascia d’età. Analisi della varianza Univariata ad una via CONCLUSIONI L’analisi ha riscontrato un effetto significativo dell’età sulla capacità di memoria dei soggetti (F2,42=4,481 ; p<0.05). In particolare si può notare, in seguito all’applicazione dell’analisi post-hoc con il metodo di Bonferroni, che i soggetti può giovani manifestano una capacità di memoria significativamente maggiore di quella dei soggetti più anziani (p=0.018). Analisi della varianza Univariata fattoriale ESEMPIO PRATICO (II) Si supponga di voler studiare gli effetti del fumo da sigaretta su alcuni tipi di prestazione. A tale scopo è stato selezionato un campione i cui soggetti sono stati suddivisi in tre gruppi rispetto al fumo: non fumatori (NS), fumatori ma non prima-durante la prova (DS), fumatori attivi prima-durante la prova (AS). In maniera casuale all’interno di ciascun gruppo un terzo dei soggetti ha fatto un compito di pattern recognition, un terzo un compito di tipo cognitivo e un terzo una simulazione di guida con un video game. In ogni caso la variabile dipendente è il numero di errori commessi. Le domande di ricerca riguardano la valutazione dell’effetto del fumo, dell’effetto del tipo di compito, e dell’eventuale interazione tra fumo e compito sulle perfomance dei soggetti. Nota: i dati sono contenuti nel file “smoking.sav” Analisi della varianza Univariata fattoriale IL MODELLO DI ANALISI Per rispondere alle domande di ricerca si adotterà un modello di analisi della varianza univariata fattoriale 3×3 con: • variabili dipendente: il numero di errori commessi • un fattore tra soggetti a 3 livelli: Fumo (Non Fumatori, Fumatori ma non prima e durante la prova, Fumatori prima e durante la prova) • un fattore tra soggetti a 3 livelli: Compito (Pattern Recognition, Cognitivo, Simulazione di Guida) Analisi della varianza Univariata fattoriale RISULTATI DELL’ANALISI DELLA VARIANZA Osservando i risultati dell’analisi della varianza si può affermare che: • il fumo complessivamente non ha un effetto significativo sulla performance • il tipo di compito ha un effetto significativo sulla performace • esiste un effetto significativo dell’interazione fumo-tipo di compito sulla performance Analisi della varianza Univariata fattoriale INTERPRETAZIONE GRAFICA DEI RISULTATI smokegr 50 ,0 0 medie marginali attese N o Smoker D elay Smoker Active Smoker 40,00 30 ,0 0 20 ,0 0 10 ,0 0 0,00 pattern re co gnition cogn itive task tas k d riving simula tio n Analisi della varianza Univariata fattoriale CONCLUSIONI L’analisi ha riscontrato un effetto significativo del tipo di compito (F2,81=73.865 ; p<0.05) e un effetto significativo dell’interazione fumo-tipo di compito (F4,81=3.261 ; p<0.05) sulle performance dei soggetti. L’effetto principale del fattore fumo non è invece risultato significativo. Si può quindi concludere che; • il fumo complessivamente non incide sulla performace; • il tipo di compito complessivamente ha influenza sulla performance; • esiste un effetto interattivo “fumo-tipo di compito” sulle performance (le differenze di performance tra i tre gruppi di fumatori non sono costanti nei tre diversi tipi di compito). Analisi della varianza Multivariata (MANOVA) L’OBIETTIVO DELL’ANALISI DELLA VARIANZA MULTIVARIATA L’obiettivo dell’analisi della varianza multivariata è quello di studiare gli effetti di uno o più fattori tra soggetti su un insieme di variabili dipendenti. (Mentre nell’Anova Univariata la variabile dipendente è una, nella Manova le variabili dipendenti sono più di una) Esempio: Si vuole studiare se i maschi differiscono complessivamente dalle femmine sui punteggi totali di tre questionari che rilevano tre diversi aspetti dell’ansia. In questo caso si adotterà un disegno di analisi della varianza multivariata (Manova) con: - 3 variabili dipendenti (i 3 aspetti dell’ansia); - 1 fattore tra soggetti (sesso). Analisi della varianza Multivariata (MANOVA) ASSUNZIONI NELL’ANALISI DELLA VARIANZA MULTIVARIATA • Le osservazioni seguono una distribuzione normale multivariata sulle variabili dipendenti in ciascun gruppo. • Le matrici di covarianza sulle variabili dipendenti di ciascun gruppo sono uguali. • Le osservazioni sono indipendenti. Analisi della varianza Multivariata (MANOVA) in SPSS 1. Selezionare il menù “Analizza”. 2. Selezionare l’opzione “Modello lineare generalizzato”. 3. Selezionare l’opzione “Multivariato”. 4. Selezionare le variabili dipendenti, i fattori between e le eventuali covariate in modo appropriato. 5. Selezionare l’opzione “opzioni” per statistiche descrittive e test dell’omogeneità delle varianza fra i gruppi. 6. Nel caso di analisi post-hoc, selezionare l’opzione “Post-Hoc” e la/le tecnica/che di analisi post-hoc desiderata/e. 7. Cliccare OK! Analisi della varianza Multivariata (MANOVA) in SPSS ESEMPIO PRATICO (III) Per capire se un nuovo approccio didattico nell’insegnamento del clarinetto è efficace, si vogliono confrontare due gruppi di alunni delle scuole elementari: - Gruppo Sperimentale (alunni che hanno seguito le lezioni con il metodo innovativo); - Gruppo di Controllo (alunni che hanno seguito le lezioni con il metodo tradizionale). I dati raccolti riguardano le perfomance degli alunni valutate sui seguenti 6 aspetti: interpretazione, tono, ritmo, intonazione, tempo, articolazione. (Ambrose, 1985) Nota: i dati sono contenuti nel file “clarinetto.sav” Analisi della varianza Multivariata (MANOVA) in SPSS IL MODELLO DI ANALISI Per valutare l’efficacia del nuovo approccio si adotterà un modello di analisi della varianza multivariata (MANOVA) con: • sei variabili dipendenti: Interpretazione, Tono, Ritmo, Intonazione, Tempo, Articolazione; • un fattore tra soggetti a 2 livelli: Gruppo (Sperimentale vs. Controllo). Analisi della varianza Multivariata (MANOVA) in SPSS ANALISI DESCRITTIVA DEI DATI Confronto tra il Gruppo Sperimentale e il Gruppo di Controllo 4.00 sperimentale controllo 3.50 media dei punteggi 3.00 2.50 2.00 1.50 1.00 0.50 0.00 interpretazione tono ritmo intonazione aspetti valutati tempo articolazione Analisi della varianza Multivariata (MANOVA) in SPSS RISULTATI DELLA MANOVA b Test multivariati Effetto Valore Intercetta Traccia di Pillai .991 Lambda di Wilks .009 Traccia di Hotelling104.434 Radice di Roy 104.434 gruppo Traccia di Pillai .584 Lambda di Wilks .416 Traccia di Hotelling 1.406 Radice di Roy 1.406 a. Statistica esatta b. Disegno: Intercept+gruppo F Ipotesi df a 278.492 6.000 a 278.492 6.000 278.492a 6.000 a 278.492 6.000 3.749a 6.000 a 3.749 6.000 a 3.749 6.000 a 3.749 6.000 Gradi di libertà dell'errore 16.000 16.000 16.000 16.000 16.000 16.000 16.000 16.000 Sig. .000 .000 .000 .000 .016 .016 .016 .016 Il fattore gruppo ha un effetto significativo Analisi della varianza Multivariata (MANOVA) in SPSS CONCLUSIONI Il Gruppo Sperimentale differisce significativamente dal Gruppo di Controllo sui 6 aspetti valutati (F6,16= 3.749 ; p<0.05). Si può quindi concludere che il nuovo approccio didattico è efficace. Analisi della varianza a misure ripetute L’OBIETTIVO DELL’ANALISI DELLA VARIANZA A MISURE RIPETUTE Il caso più semplice di analisi della varianza a misure ripetute è il t-test per dati appaiati. In quel caso i soggetti vengono misurati due volte, ad esempio prima e dopo un trattamento, e si vuole verificare l’effetto del trattamento (fattore within). L’analisi della varianza a misure ripetute può essere vista come un’estensione del test-t per dati appaiati nei casi in cui: - il fattore within ha più di due livelli; - esiste più di un fattore within. Analisi della varianza a misure ripetute ESEMPI DI APPLICAZIONE DELL’AOV A MISURE RIPETUTE Valutazione dell’effetto del tempo. Esempio: valutare se esistono variazioni dell’umore materno nel primo anno post-gravidanza. Valutazione dell’effetto di più trattamenti. Esempio: Valutare come incidono la lunghezza e la tipologia di un testo sulla comprensione. Analisi della varianza a misure ripetute I VANTAGGI DELL’AOV A MISURE RIPETUTE Controllo della variabilità entro soggetto Le differenze tra Gruppo Sperimentale e Gruppo di controllo possono dipendere sia dall’effetto del trattamento sia dalla diversa composizione dei due gruppi. In un disegno a misure ripetute invece i soggetti fungono da “controllo di se stessi” . Minor numerosità campionaria richiesta rispetto all’analisi della varianza between. Se in un disegno di analisi della varianza between per valutare l’effetto di 3 diversi trattamenti sono richiesti 45 soggetti (15 per trattamento), in un disegno a misure ripetute ne bastano 15 ! Nota: non sempre si può utilizzare un disegno a misure ripetute (ad. esempio: valutazione dell’effetto genere) Analisi della varianza a misure ripetute ASSUNZIONI NELL’ANALISI DELLA VARIANZA A MISURE RIPETUTE • Le osservazioni sono indipendenti. • Le osservazioni seguono una distribuzione normale multivariata sui livelli del fattore entro soggetti. • Le osservazioni soddisfano l’ipotesi di sfericità. Nota: Le prime due assunzioni sono richieste anche per l’analisi della varianza multivariata (MANOVA), mentre l’ipotesi di sfericità non lo è. Analisi della varianza a misure ripetute CHE COSA IMPLICA L’IPOTESI DI SFERICITA’? • L’ipotesi di sfericità implica che la matrice di covarianza sulle misure ripetute rispetti una forma particolare (varianze e covarianze pressoché costanti). • In poche parole, l’idea è che le varianze delle differenze tra le misure ripetute devono essere pressoché uguali. Analisi della varianza a misure ripetute CHE COSA IMPLICA L’IPOTESI DI SFERICITA’? Esempio: Si supponga di voler valutare la variazione di peso nel tempo in bambini neonati. Il peso dei neonati viene misurato ogni giorno per un periodo critico di 3 giorni. Il modello da adattare potrebbe essere quello di un’AOV a misure ripetute con v.d. il peso dei bambini e fattore entro soggetti il tempo (3 livelli pari ai 3 giorni). Osservando i dati si nota che: - in media i bambini sono aumentati di 100 grammi tra il giorno 1 e 2 e di 150 grammi tra il giorno 2 e 3. - la varianza degli aumenti tra il giorno 1 e 2 è di 20, mentre quella tra il giorno 2 e 3 è di 100. In questo caso l’ipotesi di sfericità che presuppone che la varianza degli aumenti tra i giorni 1 e 2 e quella tra i giorni 2 e 3 ( e anche quella tra 1 e 3) siano uguali non è soddisfatta. Il modello di AOV a misure ripetute potrebbe produrre una stima distorta della significatività dell’effetto del tempo. Analisi della varianza a misure ripetute VALUTAZIONE DELL’IPOTESI DI SFERICITA’ Per valutare se i dati soddisfano l’ipotesi di sfericità si può utilizzare il test di Mauchly Il test di Mauchly è significativo (p<0.05) ? No I dati soddisfano l’assunzione di sfercità. La stima degli effetti non è distorta. Sì I dati non soddisfano l’ipotesi di sfericità. Per ottenere una stima non distorta degli effetti si deve ricorrere a dei criteri di correzione (ad es. Greenhouse-Geisser) Analisi della varianza a misure ripetute in SPSS 1. Selezionare il menù “Analizza”. 2. Selezionare l’opzione “Modello lineare generalizzato”. 3. Selezionare l’opzione “Misure Ripetute”. 4. Nella finestra “Definisci Fattori” inserire i nomi dei fattori within ed il rispettivo numero di livelli. Cliccare “Definisci”. 5. Inserire le variabili within in modo appropriato rispetto le definizioni dei fattori fatte al punto 4. 6. Cliccare OK! Analisi della varianza a misure ripetute in SPSS ESEMPIO PRATICO (IV) Si supponga di voler studiare l’effetto di 4 diversi tipi di vino sui tempi di reazione ad una particolare prova di abilità. Nella conduzione dell’esperimento un tempo sufficiente viene fatto trascorrere tra una prova e l’altra, in modo da minimizzare gli effetti della “somministrazione” di un tipo di vino sui tempi di reazione legati alla “successiva somministrazione” (Winer, 1971). Nota: i dati sono contenuti nel file “vini.sav” Analisi della varianza a misure ripetute in SPSS IL MODELLO DI ANLISI Per valutare se il tipo di vino ha un effetto sui tempi di reazione dei soggetti si adotterà un modello di analisi della varianza a misure ripetute con: - variabile dipendente: il Tempo di Reazione dei soggetti; - un fattore entro-soggetti a 4 livelli: Tipo di Vino (Chianti, Merlot, Prosecco, Zibibbo). Analisi della varianza a misure ripetute in SPSS ANALISI DESCRITTIVA DEI DATI Confronto dei tempi di reazione medi ottenuti per tipo di vino 45 40 media dei tempi di reazione 35 30 25 20 15 10 5 0 chianti merlot prosecco tipo di vino zibibbo Analisi della varianza a misure ripetute in SPSS CONTROLLO DELL’IPOTESI DI SFERICITA’ Test di sfericità di Mauchly b Misura: MEASURE_1 Effetto entro soggetti tipo_v W di Mauchly .186 Approssimaz ione chi-quadrato 4.572 Epsilon df 5 Sig. .495 Greenhous e-Geisser .605 a Huynh-Feldt 1.000 Verifica l'ipotesi nulla per la quale la matrice di covarianza dell'errore della variabile dipendente trasformata ortonormalizzata è proporzionale a una matrice identità. a. È possibile utilizzarlo per regolare i gradi di libertà per i test di significatività mediati. I test corretti vengono visualizzati nella tabella dei test sugli effetti entro soggetti. b. Disegno: Intercept Disegno entro soggetti: tipo_v L’ipotesi di sfericità è soddisfatta. Limite inferiore .333 Analisi della varianza a misure ripetute in SPSS RISULTATI DELL’ANALISI DELLA VARIANZA A MISURE RIPETUTE Test degli effetti entro soggetti Misura: MEASURE_1 Sorgente tipo_v Errore(tipo_v) Assumendo la sfericità Greenhouse-Geisser Huynh-Feldt Limite inferiore Assumendo la sfericità Greenhouse-Geisser Huynh-Feldt Limite inferiore Somma dei quadrati Tipo III 698.200 698.200 698.200 698.200 112.800 112.800 112.800 112.800 df 3 1.815 3.000 1.000 12 7.258 12.000 4.000 Media dei quadrati 232.733 384.763 232.733 698.200 9.400 15.540 9.400 28.200 F 24.759 24.759 24.759 24.759 Il fattore within Tipo di Vino ha un effetto statisticamente significativo. Sig. .000 .001 .000 .008 Analisi della varianza a misure ripetute in SPSS CONCLUSIONI Il fattore Tipo di Vino ha un effetto statisticamente significativo sui tempi di reazione dei soggetti (F3,12= 24.759 ; p<0.05). Si può quindi concludere che a seconda del tipo di vino somministrato i tempi di reazione dei soggetti variano. Analisi della varianza con Disegno Misto COSA SI INTENDE PER “ANALISI DELLA VARIANZA CON DISEGNO MISTO?” Un modello analisi della varianza con disegno misto è un modello che comprende sia fattori between che fattori within. Analisi della varianza con Disegno Misto ESEMPIO DI UN PROBLEMA RISOLVIBILE ATTRAVERSO UN AOV CON DISEGNO MISTO Si supponga di voler misurare l’effetto di tre diversi trattamenti somministrati ad un campione comprendente maschi e femmine. La situazione può essere così rappresentata: TRATTAMENTI A B C Maschi Femmine Analisi della varianza con Disegno Misto LE DOMANDE DI RICERCA Esiste un effetto trattamento? Effetto principale del fattore within Complessivamente i soggetti rispondono in maniera diversa a seconda del trattamento? Esiste un effetto genere? Effetto principale del fattore between Interazione tra fattore within e between Complessivamente i maschi rispondono in maniera diversa rispetto alle femmine? Esistono dei legami tra il tipo di trattamento e il genere dei soggetti? Le differenze tra i maschi e le femmine sono costanti o variano a seconda del tipo di trattamento? Analisi della varianza con Disegno Misto IL MODELLO DI ANALISI Il modello da adattare ai dati sarà un modello di analisi della varianza a disegno misto 3×2 con: • variabile dipendente: le risposte dei soggetti • un fattore within a 3 livelli: trattamento (A, B, C) • un fattore between a 2 livelli: sesso (Maschi vs. Femmine) Analisi della varianza con Disegno Misto in SPSS 1. Selezionare il menù “Analizza”. 2. Selezionare l’opzione “Modello lineare generalizzato”. 3. Selezionare l’opzione “Misure Ripetute”. 4. Nella finestra “Definisci Fattori” inserire i nomi dei fattori within ed il rispettivo numero di livelli. Cliccare “Definisci”. 5. Inserire le variabili within in modo appropriato rispetto le definizioni dei fattori fatte al punto 4. 6. Selezionare i fattori between e le eventuali covariate. 7. Cliccare OK! Analisi della varianza con Disegno Misto in SPSS ESEMPIO PRATICO (V) A due gruppi, uno sottoposto a una condizione stressante (gruppo sperimentale) ed uno sottoposto ad una condizione neutra (gruppo di controllo), vengono letti tre brani di crescente difficoltà. Dopo la lettura di ciascun brano vengono poste ai soggetti 10 domande di comprensione del testo e viene rilevato il numero di risposte corrette. Si vogliono studiare i seguenti aspetti: • la difficoltà dei brani ha un effetto sul numero di risposte corrette? • il gruppo sottoposto ad una condizione di stress risponde complessivamente in maniera diversa rispetto al gruppo di controllo? • esiste un’interazione tra la difficoltà dei brani ed il livello di stress (le differenze tra i due gruppi sono costanti per i tre livelli di difficoltà dei brani)? Nota: i dati sono contenuti nel file “stress.sav” Analisi della varianza con Disegno Misto in SPSS IL MODELLO DI ANLISI Il modello da applicare sarà un modello di analisi della varianza a disegno misto 3×2 con: • variabile dipendente: il numero di risposte corrette • un fattore within a 3 livelli: difficoltà del brano (1,2,3) • un fattore between a 2 livelli: gruppo (sperimentale vs. controllo) Analisi della varianza con Disegno Misto in SPSS CONTROLLO DELL’IPOTESI DI SFERICITA’ Test di sfericità di Mauchly b Misura: MEASURE_1 Effetto entro soggetti difficol W di Mauchly .673 Approssima zione chi-quadrato 6.733 df 2 Sig. .035 La sfericità non è soddisfatta. Bisognerà adottare un criterio correttivo. Analisi della varianza con Disegno Misto in SPSS RISULTATI DELL’ANALISI DELLA VARIANZA CON DISEGNO MISTO Effetto siginificativo del fattore within. Effetto siginificativo dell’interazione tra il fattore within e quello between Analisi della varianza con Disegno Misto in SPSS RISULTATI DELL’ANALISI DELLA VARIANZA CON DISEGNO MISTO Effetto significativo del fattore between. Analisi della varianza con Disegno Misto in SPSS INTERPRETAZIONE GRAFICA DEI RISULTATI Analisi della varianza con Disegno Misto in SPSS CONCLUSIONI L’analisi condotta ha messo in evidenza i seguenti aspetti: • emerge un effetto significativo del fattore within “difficoltà” (F1.507,27.129=20.028 ; p<0.05); • emerge un effetto significativo del fattore between “gruppo” (F1.507,27.129=5.861 ; p<0.05); • emerge un effetto significativo dell’interazione tra il fattore within e il fattore within (F1,18=9.227 ; p<0.05). Si può quindi concludere che: • la difficoltà del brano influenza il numero di risposte corrette; • i due gruppi differiscono sulla base del numero di riposte corrette; • le differenze tra i due gruppi non sono costanti per i tre livelli di difficoltà dei brani; in particolare si può notare che nella condizione “alta difficoltà” dei brani, la differenza tra i due gruppi è molto maggiore rispetto a quelle che si registrano nelle condizioni “media e bassa difficoltà”. Analisi della varianza COSA FARE QUANDO LE ASSUNZIONI PER L’ANALISI DELLA VARIANZA NON SONO SODDISFATTE? Se le assunzioni per l’analisi della varianza non sono soddisfatte, cioè ad esempio: • la variabile dipendente non è quantitativa ma è su scala ordinale; • la variabile dipendente non è distribuita normalmente; • la numerosità campionaria è ridotta. E’ POSSIBILE ADOTTARE UN APPROCCIO NON PARAMETRICO I vantaggi dell’approccio Nonparametrico Le tecniche non-parametriche, che si basano sui ranghi e non sui valori originali come le tecniche parametriche, presentano i seguenti principali vantaggi: sono “distribution-free”, cioè indipendenti dalla distribuzione campionaria della variabile dipendente; sono particolarmente indicate nei casi di ridotta numerosità campionaria. Alternative Non-parametriche all’analisi della varianza con fattore between NUMERO DI LIVELLI DEL FATTORE BETWEEN ANALISI PARAMETRICA ANALISI NONPARAMETRICA due test t per campioni indipendenti test di Mann-Whitney due o più di due analisi della varianza ad un fattore between test di Kruskal-Wallis Alternative Non-parametriche all’analisi della varianza a misure ripetute con fattore within NUMERO DI LIVELLI DEL FATTORE WITHIN ANALISI PARAMETRICA ANALISI NONPARAMETRICA due test t per campioni appaiati test di Wilcoxon due o più di due analisi della varianza a misure ripetute test di Friedman Alternative Non-parametriche all’analisi della varianza a misure ripetute con fattore within (variabile dipendente dicotomica) NUMERO DI LIVELLI DEL FATTORE WITHIN due due o più di due ANALISI PARAMETRICA ANALISI NONPARAMETRICA - test di McNemar - test di Cochran L’approccio Non-parametrico in SPSS 1. Selezionare il menù “Analizza”. 2. Selezionare l’opzione “Test non parametrici”. 3. Selezionare l’opzione che si intende utilizzare. 4. Selezionare le variabili di interesse in modo appropriato. 5. Cliccare OK! “Mi conviene usare le tecniche parametriche o quelle non parametriche?” Quando le assunzioni per l’analisi della varianza sono soddisfatte, l’approccio parametrico è più “potente” (migliore) di quello non-parametrico. Nel caso in cui le assunzioni per l’analisi della varianza sono dubbie, è conveniente utilizzare sia l’approccio parametrico che quello nonparametrico e confrontare i risultati. Per approfondimenti Per approfondire le tecniche di Analisi della Varianza si consigliano i seguenti testi: “Using Multivariate Statistics” (5th edition) – Barbara G. Tabachnick & Linda S. Fidell, 2007 – Pearson Education “Applied Multivariate Statistics For The Social Sciences, Fourth Edition” – James P. Stevens, 2002 – LEA, Publishers