Analisi della varianza - Università degli studi di Bergamo

Analisi della varianza
Analisi della varianza
L’analisi della varianza (ANOVA, ANalysis Of VAriance) è una tecnica di
analisi dei dati che consente di verificare ipotesi relative a differenze tra le
medie di due o più popolazioni.
L’analisi della varianza è una tecnica statistica di tipo parametrico:
• si assume che la variabile di interesse si distribuisca normalmente nella
popolazione e che i due campioni siano estratti in maniera casuale dalla
popolazione;
• la numerosità campionaria è rilevante
• nel confronto tra più campioni le varianze devono essere omogenee.
Analisi della varianza
È possibile classificare i diversi modelli di ANOVA in base al numero di
variabili indipendenti e dipendenti:
• i modelli che prevedono una sola variabile indipendente vengono definiti
disegni a una via;
• i modelli che prevedono due o più variabili indipendenti vengono definiti
disegni fattoriali;
• i modelli che prevedono una sola variabile dipendente definiscono
un’analisi della varianza univariata;
• i modelli che prevedono due o più variabili dipendenti definiscono un’analisi
della varianza multivariata (o MANOVA, Multivariate Analysis of Variance)
Analisi della varianza univariata:
disegni “tra soggetti” ad un solo
fattore
Vengono definiti “tra soggetti”, oppure per gruppi indipendenti, i disegni in cui
ad ogni trattamento o condizione sperimentale corrisponde un diverso
gruppo di soggetti. In ogni condizione ci sono soggetti diversi: un soggetto
esposto ad una condizione non viene esposto a nessun’altra condizione.
A
B
S1
S11
S2
S12
…
…
S10
Sn
Il modello teorico
dell’ANOVA
Nel modello teorico dell’ANOVA “tra i soggetti” il punteggio yij di un soggetto j
nel gruppo i è così scomponibile:
yij = µ + αi + εij
Dove:
µ è la media generale dei punteggi sul campione totale;
αi è l’effetto dovuto al trattamento (livello i della variabile indipendente), ed è
costante all’interno del trattamento;
εij è una componente “residua”, o di errore causale, specifica per ogni
soggetto
Il modello teorico
dell’ANOVA
SCOMPOSIZIONE DELLA DEVIANZA
La devianza rappresenta la somma dei quadrati degli scostamenti tra ogni
punteggio e la media.
I diversi tipi di devianza:
• devianza totale (SST): è la somma dei quadrati (sum of squares) degli
scarti (differenza tra i singoli punteggi e la media generale della variabile);
• devianza tra i gruppi (o between, SSB): è la somma dei quadrati degli
scarti (differenza tra i punteggi medi di gruppo e la media generale), ovvero
la variabilità tra i diversi gruppi;
• devianza entro i gruppi (o within, SSW): è la somma dei quadrati degli
scarti tra i punteggi di ogni soggetto e la relativa media di gruppo, ovvero alla
variabilità dei soggetti all’interno di ogni gruppo.
Il modello teorico
dell’ANOVA
GRADI DI LIBERTA’ E VARIANZE
Gradi di libertà (gdl) per ognuna delle componenti della variabilità:
2
(
y
−
y
)
∑ i ∑ j ij .. , n–1 gdl (il gdl perso è quello
• devianza totale (SST):
della media totale);
• devianza tra i gruppi (o between, SSB):
perso è quello della media totale);
2
(
y
−
y
)
∑ i ∑ j i ..
• devianza entro i gruppi (o within, SSW):
perde un gdl per ogni media di gruppo).
∑∑
i
, k–1 gdl (il gdl
2
(
y
−
y
)
ij
i.
j
, n–k gdl (si
Dividendo le devianze per i rispettivi gradi di libertà si ottengono le varianze:
• Varianza totale (MST) = devianza totale / n–1;
• Varianza tra i gruppi (MSB) = devianza tra i gruppi / k–1;
• Varianza entro i gruppi (MSW) = devianza entro i gruppi / n–k.
Il modello teorico
dell’ANOVA
IL RAPPORTO «F»
Il rapporto tra le varianze MSB / MSW segue la distribuzione F, quindi può
essere utilizzato per esaminare ipotesi sulla significatività della differenza tra
la variabilità dovuta al trattamento e quella residua
La F esamina le seguenti ipotesi:
H0: µ1 = µ2 = … = µk
H1: almeno due µ diverse
Il modello teorico
dell’ANOVA
ASSUNZIONI
Ci sono delle assunzioni che devono essere soddisfatte affinché i risultati
dell’ANOVA possano essere interpretati in maniera affidabile:
• gli errori (εij) devono seguire la distribuzione normale ed avere media
uguale a 0;
• la varianza degli errori (σε) deve essere uguale in ogni gruppo (condizione
di omoschedasticità);
• gli errori (εij) devono essere indipendenti;
• gli effetti hanno una natura additiva: la variabile sperimentale «aggiunge»
qualcosa alla condizione-base e lo fa in maniera «identica» per tutti i
soggetti.
Analisi della varianza univariata:
disegni fattoriali
Vengono definiti fattoriali (o più vie) i disegni di analisi della varianza in cui
vi sono due o più variabili indipendenti. Nei disegni fattoriali vengono
esaminati gli effetti di due o più variabili indipendenti sulla variabile
dipendente.
Il più semplice disegno è il «2 x 2», dove abbiamo due fattori ciascuno dei
quali ha due differenti livelli.
Vantaggi dei disegni fattoriali:
• consentono lo studio dell’interazione. Cioè l’effetto congiunto delle VI sulla
VD
• aumentano la potenza del test, cioè la probabilità di rilevare la presenza di
un effetto, quindi la probabilità di rifiutare l’ipotesi nulla quando essa è falsa
• consentono una maggiore economia nel numero dei soggetti da esaminare,
mantenendo la stessa potenza del test.
Analisi della varianza univariata:
disegni fattoriali
EFFETTI PRINCIPALI E INTERAZIONI
Nei disegni fattoriali abbiamo due tipi di effetti: gli effetti principali e le
interazioni.
L’effetto principale rappresenta l’effetto medio di una variabile indipendente
sulla variabile dipendente, indipendentemente dai valori delle altre variabili
indipendenti.
L’interazione rappresenta l’effetto di una variabile indipendente sulla
variabile dipendente non è lo stesso per tutti i livelli delle altre variabili
indipendenti.
Analisi della varianza univariata:
disegni fattoriali
DISEGNI FATTORIALI «TRA SOGGETTI» (BETWEEN SUBJECTS)
Nei disegni fattoriali «tra i soggetti» tutti i fattori sono fattori between
subjects, ovvero i soggetti vengono assegnati ad ognuna delle singole celle,
quindi ogni soggetto è esposto solamente ad una particolare combinazione
delle condizioni sperimentali.
A1
A2
B1
S1
S2
…
S6
S7
…
B2
S11
S12
…
S16
S17
…
Analisi della varianza univariata:
disegni “entro i soggetti” ad un solo
fattore
I disegni entro i soggetti (o within subjects) sono disegni in cui si utilizzano gli
stessi soggetti nelle diverse condizioni sperimentali. Nel caso di disegni entro
i soggetti l’analisi della varianza viene anche detta per prove (o misure)
ripetute.
A
B
S1
S1
S2
S2
…
…
Sn
Sn
Analisi della varianza univariata:
disegni “entro i soggetti” ad un solo
fattore
SCOMPOSIZIONE DELLA DEVIANZA TOTALE
2
(
y
−
y
)
∑ i ∑ j ij .. , [nk–1 gdl];
2
• devianza tra le prove (SSk): ∑ i ∑ j ( y. j − y.. ) , [k–1 gdl];
• devianza totale (SST):
2
(
y
−
y
)
∑ i ∑ j 2 ij . j , [k(n–1) gdl]
• devianza tra i soggetti (SSS): ∑ i ∑ j ( yi. − y.. ) , [n–1 gdl];
• devianza entro i gruppi (o within, SSW):
• devianza residua (SSres): SSW – SSs , [(n–1)(k–1) gdl];
Analisi della varianza univariata:
disegni “entro i soggetti” ad un solo
fattore
ASSUNZIONI
Ci sono delle assunzioni che devono essere soddisfatte affinché i risultati
possano essere interpretati in maniera affidabile:
• gli errori (εij) devono essere indipendenti;
• gli errori (εij) devono seguire la distribuzione normale ed avere media
uguale a 0;
• la varianza delle differenze tra tutte le coppie delle misure ripetute deve
essere uguale (sfericità o circolarità);
•gli effetti hanno una natura additiva: la variabile sperimentale «aggiunge»
qualcosa alla condizione-base e lo fa in maniera «identica» per tutti i
soggetti.
Analisi della varianza
disegni fattoriali «Misti»
Nei disegni fattoriali «misti», almeno un fattore è tra i soggetti ed almeno un
fattore è entro i soggetti.
I soggetti vengono esposti a tutte le condizioni sperimentali della variabile
entro, e soltanto ad un livello della variabile tra.
A1
A2
B1
S1
S2
…
S1
S2
…
B2
S6
S7
…
S6
S7
…
Analisi della varianza
- Le variabili -
La o le variabili dipendenti sono di tipo quantitativo (scala intervalli o
rapporto).
Le variabili indipendenti possono essere di due tipi:
• categoriale o qualitativo a loro volta distinte in variabili:
- tra soggetti o fattori beetween
- entro soggetti o fattori within
• quantitativo note anche come covariate.
Analisi della varianza Univariata
OBIETTIVO ANALISI DELLA VARIANZA UNIVARIATA BETWEEN
Il caso più semplice di analisi della varianza univariata è il t-test per
campioni indipendenti. In quel caso l’obiettivo è quello di confrontare, per
una fissata variabile dipendente, le medie di due gruppi indipendenti di
soggetti (fattore between a 2 livelli).
L’analisi della varianza univariata può essere vista come un’estensione del
t-test per campioni indipendenti nei casi in cui:
- il fattore between ha più di due livelli (aov a una via);
- esiste più di un fattore between (aov a due o più vie, o aov fattoriale).
Analisi della varianza Univariata
ESEMPI DI APPLICAZIONE AOV AD UNA VIA
Si supponga di aver somministrato un test di logica ad un campione di
soggetti provenienti da tre tipi differenti di scuole superiori (liceo classico,
liceo scientifico, liceo artistico); e di voler valutare se esiste un effetto “scuola
di provenienza” sul numero di risposte corrette al test.
Il modello da adottare sarà quello di analisi della varianza ad una via con:
variabile dipendente: il numero di risposte corrette al test
variablie indipendente
un fattore beetween a 3 livelli: scuola di
provenienza (classico, scientifico, artistico)
Analisi della varianza Univariata
ESEMPI DI APPLICAZIONE AOV FATTORIALE
Riprendendo l’esempio precedente si supponga di disporre anche della classe di
provenienza dei soggetti, e di voler valutare i seguenti aspetti:
• Complessivamente i soggetti rispondono in maniera diversa a seconda della
scuola di provenienza?
• Complessivamente i soggetti rispondo in maniera diversa a seconda della
classe frequentata?
• Esiste un interazione tra il tipo di scuola di provenienza e la classe frequentata?
(le differenze tra i tipi di scuola sono costanti per ogni livello di classe
frequentata? )
Il modello da adattare ai dati sarà di analisi della varianza 3x5 con:
variabile dipendente: il numero di risposte corrette;
un fattore between a 3 livelli: “scuola di provenienza” (classico, scientifico,
artistico);
un fattore between a 5 livelli: “classe” (Ia, IIa, IIIa, IVa, Va)
Analisi della varianza Univariata
ASSUNZIONI
• Le osservazioni seguono una distribuzione normale sulla variabile
dipendente in ciascun gruppo.
• Le varianze dei gruppi sono uguali (omogenietà della varianza).
• Le osservazioni sono indipendenti.
Analisi della varianza Univariata ad una via
L’APPROCCIO STATISTICO
LA FORMULAZIONE DEL PROBLEMA
H0
µ1 = µ2 = µ3 = ….. = µk
H1
almeno una media
è diversa dalle altre
Nota: K è il numero di livelli del fattore between
Analisi della varianza Univariata ad una via
L’APPROCCIO STATISTICO
LA SCOMPOSIZIONE DELLA DEVIANZA
Devianza totale
(N-1)
Devianza tra i gruppi
(k-1)
Nota: N è il numero di oservazioni
K è il numero di livelli del fattore between
Devianza entro i gruppi
(N-k)
Analisi della varianza Univariata ad una via
L’APPROCCIO STATISTICO
IL RAPPORTO: (VARIANZA TRA SOGG.) / (VARIANZA ENTRO SOGG.)
Dividendo le devianze (SS) per i rispettivi gradi di libertà si ottengono le
varianze (MS). Sotto H0 il rapporto tra le varianze ha una distribuzione nota:
F
Oss
MSTra
=
≈ F ( dfTra , df Entro )
MS Entro
Se la probabilità associata (p-value) al valore di F osservato è minore di un
valore critico fissato a priori (ad esempio 0.05), si rifiuta H0.
In questo caso si può conludere che il fattore between, ha un effetto
statisticamente significativo sulla variabile dipendente.
Analisi della varianza Univariata ad una via
L’ANALISI POST-HOC
Se l’analisi della varianza è risultata significativa, si potrebbe essere
interessati a capire quali tra le medie dei livelli del fattore between
differiscono tra loro.
La tentazione potrebbe essere quella di applicare una serie di t-test per
confrontare tutte le medie tra loro.
ERRORE
Analisi della varianza Univariata ad una via
L’ANALISI POST-HOC
Infatti, aumentando il numero di test effettuati, aumenta la probabilità di
errore di I° tipo: se testiamo un’ipotesi nulla che in effetti è vera, utilizzando α
come valore critico, la probabilità di ottenere un risultato non significativo
(corretto) è 1-α; se testiamo 2 ipotesi indipendenti la probabilità che nessuno
dei 2 test sia significativo è data, per un teorema del calcolo delle probabilità,
dal prodotto delle probabilità (1-α)*(1-α); più generalmente se testiamo K
ipotesi indipendenti la probabilità che i test siano congiuntamente non
significativi è data da (1-α)K; ne consegue che la probabilità di avere almeno
un test significativo sarà 1-(1-α)K.
Esemplificando, se vengono testate 20 ipotesi indipendenti al livello di
significatività α = 0,05, la probabilità che nessuna sia significativa è 0,9520 =
0,36. La probabilità che almeno una sia significativa per errore sarà
1-(1-0,05)20 = 0,64, ben superiore al valore nominale prescelto del 5%.
Analisi della varianza Univariata ad una via
L’ANALISI POST-HOC
Per “mantenere sotto controllo” la probabilità di errore globale esistono delle
tecniche dette di “analisi post-hoc” che mirano a correggere la probabilità di
errore dei singoli confronti tra le medie, in modo da ottenere dei risultati
statisticamente corretti.
Analisi della varianza Univariata
I PASSI FONDAMENTALI
1. Identificazione della variabile dipendente e del fattore between (o dei
fattori between).
2. Definizione del modello di analisi.
3. Analisi descrittiva dei dati.
4. Verifica delle assunzioni teoriche.
5. Adattamento del modello ai dati.
6. Verifica della significatività degli effetti.
7. Eventuale analisi post-hoc
Analisi della varianza Univariata ad una via in
SPSS
1. Selezionare il menù “Analizza”.
2. Selezionare l’opzione “Confronta Medie”.
3. Selezionare l’opzione “Anova Univariata”.
4. Selezionare la variabili dipendente e il fattore between.
5. Selezionare l’opzione “opzioni” per statistiche descrittive e test
dell’omogeneità delle varianza fra i gruppi.
6. Nel caso di analisi post-hoc, selezionare l’opzione “Post-Hoc” e la/le
tecnica/che di analisi post-hoc desiderata/e.
7. Cliccare OK!
Analisi della varianza Univariata fattoriale in
SPSS
1. Selezionare il menù “Analizza”.
2. Selezionare l’opzione “Modello Lineare Generalizzato”.
3. Selezionare l’opzione “Univariata”.
4. Selezionare la variabile dipendente, i fattori between e le eventuali
variabili indipendenti covariate.
5. Selezionare l’opzione “opzioni” per statistiche descrittive e test
dell’omogeneità delle varianza fra i gruppi.
6. Nel caso di analisi post-hoc, selezionare l’opzione “Post-Hoc” e la/le
tecnica/che di analisi post-hoc desiderata/e.
7. Cliccare OK!
Analisi della varianza Univariata ad una via
ESEMPIO PRATICO (I)
Si supponga di aver somministrato un test sulla memoria ad un campione di
soggetti appartenenti a tre fasce d’età (20-29 anni, 30-49 anni, 50 anni e
oltre).
Si vuole valutare se l’età ha un effetto sulla memoria.
Nota: i dati sono contenuti nel file “memoria.sav”
Analisi della varianza Univariata ad una via
IL MODELLO DI ANALISI
Per valutare l’effetto dell’età sulla memoria si adotterà un modello di analisi
della varianza univariata ad una via con:
• variabili dipendente: il numero di risposte corrette al test
• un fattore tra soggetti a 3 livelli: Età (20-29 anni, 30-49 anni, 50 e oltre)
Analisi della varianza Univariata ad una via
ANALISI DESCRITTIVA DEI DATI
Analisi della varianza Univariata ad una via
VERIFICA DELL’IPOTESI DI NORMALITA’
Analisi della varianza Univariata ad una via
VERIFICA DELL’IPOTESI DI OMOGENEITA’ DELLE VARIANZE
Test di omogeneità delle varianze
numero di rispote corrette
Statistica
di Levene
1.407
df1
df2
2
42
Sig.
.256
Osservando il valore di significatività del test di Levene si può
concludere che le varianze dei tre gruppi di soggetti sono omogenee.
Analisi della varianza Univariata ad una via
I RISULTATI DELL’ANALISI DELLA VARIANZA
ANOVA univariata
numero di rispote corrette
Fra gruppi
Entro gruppi
Totale
Somma dei
quadrati
1086.711
5093.200
6179.911
df
2
42
44
Media dei
quadrati
543.356
121.267
F
4.481
Sig.
.017
Osservando il valore di significatività (p-value) del test F si può
concludere che l’età ha un effetto significativo sulla memoria.
Analisi della varianza Univariata ad una via
I RISULTATI DEL POST-HOC
Confronti multipli
Variabile dipendente: numero di rispote corrette
Bonferroni
(I) età
20-29 anni
30-49 anni
50 anni e oltre
(J) età
30-49 anni
50 anni e oltre
20-29 anni
50 anni e oltre
20-29 anni
30-49 anni
Differenza fra
medie (I-J)
3.26667
11.66667*
-3.26667
8.40000
-11.66667*
-8.40000
Errore std.
4.02106
4.02106
4.02106
4.02106
4.02106
4.02106
Sig.
1.000
.018
1.000
.128
.018
.128
Intervallo di confidenza
95%
Limite
Limite
inferiore
superiore
-6.7605
13.2938
1.6395
21.6938
-13.2938
6.7605
-1.6272
18.4272
-21.6938
-1.6395
-18.4272
1.6272
*. La differenza tra le medie è significativa al livello .05.
Dall’analisi post-hoc con il metodo di Bonferroni emerge che l’unica
differenza significativa è quella tra la prima e la terza fascia d’età.
Analisi della varianza Univariata ad una via
CONCLUSIONI
L’analisi ha riscontrato un effetto significativo dell’età sulla capacità di
memoria dei soggetti (F2,42=4,481 ; p<0.05).
In particolare si può notare, in seguito all’applicazione dell’analisi post-hoc
con il metodo di Bonferroni, che i soggetti può giovani manifestano una
capacità di memoria significativamente maggiore di quella dei soggetti più
anziani (p=0.018).
Analisi della varianza Univariata fattoriale
ESEMPIO PRATICO (II)
Si supponga di voler studiare gli effetti del fumo da sigaretta su alcuni tipi di
prestazione. A tale scopo è stato selezionato un campione i cui soggetti sono
stati suddivisi in tre gruppi rispetto al fumo: non fumatori (NS), fumatori ma
non prima-durante la prova (DS), fumatori attivi prima-durante la prova (AS).
In maniera casuale all’interno di ciascun gruppo un terzo dei soggetti ha fatto
un compito di pattern recognition, un terzo un compito di tipo cognitivo e un
terzo una simulazione di guida con un video game. In ogni caso la variabile
dipendente è il numero di errori commessi.
Le domande di ricerca riguardano la valutazione dell’effetto del fumo,
dell’effetto del tipo di compito, e dell’eventuale interazione tra fumo e
compito sulle perfomance dei soggetti.
Nota: i dati sono contenuti nel file “smoking.sav”
Analisi della varianza Univariata fattoriale
IL MODELLO DI ANALISI
Per rispondere alle domande di ricerca si adotterà un modello di analisi della
varianza univariata fattoriale 3×3 con:
• variabili dipendente: il numero di errori commessi
• un fattore tra soggetti a 3 livelli: Fumo (Non Fumatori, Fumatori ma non
prima e durante la prova, Fumatori prima e durante la prova)
• un fattore tra soggetti a 3 livelli: Compito (Pattern Recognition, Cognitivo,
Simulazione di Guida)
Analisi della varianza Univariata fattoriale
RISULTATI DELL’ANALISI DELLA VARIANZA
Osservando i risultati dell’analisi della varianza si può affermare che:
• il fumo complessivamente non ha un effetto significativo sulla performance
• il tipo di compito ha un effetto significativo sulla performace
• esiste un effetto significativo dell’interazione fumo-tipo di compito sulla
performance
Analisi della varianza Univariata fattoriale
INTERPRETAZIONE GRAFICA DEI RISULTATI
smokegr
50 ,0 0
medie marginali attese
N o Smoker
D elay Smoker
Active Smoker
40,00
30 ,0 0
20 ,0 0
10 ,0 0
0,00
pattern re co gnition
cogn itive task
tas k
d riving simula tio n
Analisi della varianza Univariata fattoriale
CONCLUSIONI
L’analisi ha riscontrato un effetto significativo del tipo di compito (F2,81=73.865
; p<0.05) e un effetto significativo dell’interazione fumo-tipo di compito
(F4,81=3.261 ; p<0.05) sulle performance dei soggetti. L’effetto principale del
fattore fumo non è invece risultato significativo.
Si può quindi concludere che;
• il fumo complessivamente non incide sulla performace;
• il tipo di compito complessivamente ha influenza sulla performance;
• esiste un effetto interattivo “fumo-tipo di compito” sulle performance (le
differenze di performance tra i tre gruppi di fumatori non sono costanti nei tre
diversi tipi di compito).
Analisi della varianza Multivariata
(MANOVA)
L’OBIETTIVO DELL’ANALISI DELLA VARIANZA MULTIVARIATA
L’obiettivo dell’analisi della varianza multivariata è quello di studiare gli effetti
di uno o più fattori tra soggetti su un insieme di variabili dipendenti.
(Mentre nell’Anova Univariata la variabile dipendente è una, nella Manova le
variabili dipendenti sono più di una)
Esempio: Si vuole studiare se i maschi differiscono complessivamente dalle
femmine sui punteggi totali di tre questionari che rilevano tre diversi aspetti
dell’ansia.
In questo caso si adotterà un disegno di analisi della varianza multivariata
(Manova) con:
- 3 variabili dipendenti (i 3 aspetti dell’ansia);
- 1 fattore tra soggetti (sesso).
Analisi della varianza Multivariata
(MANOVA)
ASSUNZIONI NELL’ANALISI DELLA VARIANZA MULTIVARIATA
• Le osservazioni seguono una distribuzione normale multivariata sulle
variabili dipendenti in ciascun gruppo.
• Le matrici di covarianza sulle variabili dipendenti di ciascun gruppo sono
uguali.
• Le osservazioni sono indipendenti.
Analisi della varianza Multivariata (MANOVA) in
SPSS
1. Selezionare il menù “Analizza”.
2. Selezionare l’opzione “Modello lineare generalizzato”.
3. Selezionare l’opzione “Multivariato”.
4. Selezionare le variabili dipendenti, i fattori between e le eventuali
covariate in modo appropriato.
5. Selezionare l’opzione “opzioni” per statistiche descrittive e test
dell’omogeneità delle varianza fra i gruppi.
6. Nel caso di analisi post-hoc, selezionare l’opzione “Post-Hoc” e la/le
tecnica/che di analisi post-hoc desiderata/e.
7. Cliccare OK!
Analisi della varianza Multivariata (MANOVA) in
SPSS
ESEMPIO PRATICO (III)
Per capire se un nuovo approccio didattico nell’insegnamento del clarinetto è
efficace, si vogliono confrontare due gruppi di alunni delle scuole elementari:
- Gruppo Sperimentale (alunni che hanno seguito le lezioni con il metodo
innovativo);
- Gruppo di Controllo (alunni che hanno seguito le lezioni con il metodo
tradizionale).
I dati raccolti riguardano le perfomance degli alunni valutate sui seguenti 6
aspetti: interpretazione, tono, ritmo, intonazione, tempo, articolazione.
(Ambrose, 1985)
Nota: i dati sono contenuti nel file “clarinetto.sav”
Analisi della varianza Multivariata (MANOVA) in
SPSS
IL MODELLO DI ANALISI
Per valutare l’efficacia del nuovo approccio si adotterà un modello di analisi
della varianza multivariata (MANOVA) con:
• sei variabili dipendenti: Interpretazione, Tono, Ritmo, Intonazione, Tempo,
Articolazione;
• un fattore tra soggetti a 2 livelli: Gruppo (Sperimentale vs. Controllo).
Analisi della varianza Multivariata (MANOVA) in
SPSS
ANALISI DESCRITTIVA DEI DATI
Confronto tra il Gruppo Sperimentale e il Gruppo di Controllo
4.00
sperimentale
controllo
3.50
media dei punteggi
3.00
2.50
2.00
1.50
1.00
0.50
0.00
interpretazione
tono
ritmo
intonazione
aspetti valutati
tempo
articolazione
Analisi della varianza Multivariata (MANOVA) in
SPSS
RISULTATI DELLA MANOVA
b
Test multivariati
Effetto
Valore
Intercetta Traccia di Pillai
.991
Lambda di Wilks
.009
Traccia di Hotelling104.434
Radice di Roy
104.434
gruppo Traccia di Pillai
.584
Lambda di Wilks
.416
Traccia di Hotelling 1.406
Radice di Roy
1.406
a. Statistica esatta
b. Disegno: Intercept+gruppo
F
Ipotesi df
a
278.492
6.000
a
278.492
6.000
278.492a
6.000
a
278.492
6.000
3.749a
6.000
a
3.749
6.000
a
3.749
6.000
a
3.749
6.000
Gradi di
libertà
dell'errore
16.000
16.000
16.000
16.000
16.000
16.000
16.000
16.000
Sig.
.000
.000
.000
.000
.016
.016
.016
.016
Il fattore gruppo
ha un effetto
significativo
Analisi della varianza Multivariata (MANOVA) in
SPSS
CONCLUSIONI
Il Gruppo Sperimentale differisce significativamente dal Gruppo di Controllo
sui 6 aspetti valutati (F6,16= 3.749 ; p<0.05).
Si può quindi concludere che il nuovo approccio didattico è efficace.
Analisi della varianza a misure ripetute
L’OBIETTIVO DELL’ANALISI DELLA VARIANZA A MISURE RIPETUTE
Il caso più semplice di analisi della varianza a misure ripetute è il t-test
per dati appaiati. In quel caso i soggetti vengono misurati due volte, ad
esempio prima e dopo un trattamento, e si vuole verificare l’effetto del
trattamento (fattore within).
L’analisi della varianza a misure ripetute può essere vista come
un’estensione del test-t per dati appaiati nei casi in cui:
- il fattore within ha più di due livelli;
- esiste più di un fattore within.
Analisi della varianza a misure ripetute
ESEMPI DI APPLICAZIONE DELL’AOV A MISURE RIPETUTE
Valutazione dell’effetto del tempo.
Esempio: valutare se esistono variazioni dell’umore materno nel primo anno
post-gravidanza.
Valutazione dell’effetto di più trattamenti.
Esempio: Valutare come incidono la lunghezza e la tipologia di un testo
sulla comprensione.
Analisi della varianza a misure ripetute
I VANTAGGI DELL’AOV A MISURE RIPETUTE
Controllo della variabilità entro soggetto
Le differenze tra Gruppo Sperimentale e Gruppo di controllo possono
dipendere sia dall’effetto del trattamento sia dalla diversa composizione dei due
gruppi. In un disegno a misure ripetute invece i soggetti fungono da “controllo di
se stessi” .
Minor numerosità campionaria richiesta rispetto all’analisi della varianza
between.
Se in un disegno di analisi della varianza between per valutare l’effetto di 3
diversi trattamenti sono richiesti 45 soggetti (15 per trattamento), in un disegno a
misure ripetute ne bastano 15 !
Nota: non sempre si può utilizzare un disegno a misure ripetute (ad. esempio:
valutazione dell’effetto genere)
Analisi della varianza a misure ripetute
ASSUNZIONI NELL’ANALISI DELLA VARIANZA A MISURE RIPETUTE
• Le osservazioni sono indipendenti.
• Le osservazioni seguono una distribuzione normale multivariata sui livelli
del fattore entro soggetti.
• Le osservazioni soddisfano l’ipotesi di sfericità.
Nota: Le prime due assunzioni sono richieste anche per l’analisi della varianza
multivariata (MANOVA), mentre l’ipotesi di sfericità non lo è.
Analisi della varianza a misure ripetute
CHE COSA IMPLICA L’IPOTESI DI SFERICITA’?
• L’ipotesi di sfericità implica che la matrice di covarianza sulle misure ripetute
rispetti una forma particolare (varianze e covarianze pressoché costanti).
• In poche parole, l’idea è che le varianze delle differenze tra le misure
ripetute devono essere pressoché uguali.
Analisi della varianza a misure ripetute
CHE COSA IMPLICA L’IPOTESI DI SFERICITA’?
Esempio: Si supponga di voler valutare la variazione di peso nel tempo in bambini
neonati. Il peso dei neonati viene misurato ogni giorno per un periodo critico di 3 giorni.
Il modello da adattare potrebbe essere quello di un’AOV a misure ripetute con v.d. il
peso dei bambini e fattore entro soggetti il tempo (3 livelli pari ai 3 giorni).
Osservando i dati si nota che:
- in media i bambini sono aumentati di 100 grammi tra il giorno 1 e 2 e di 150 grammi
tra il giorno 2 e 3.
- la varianza degli aumenti tra il giorno 1 e 2 è di 20, mentre quella tra il giorno 2 e 3 è
di 100.
In questo caso l’ipotesi di sfericità che presuppone che la varianza degli aumenti tra i
giorni 1 e 2 e quella tra i giorni 2 e 3 ( e anche quella tra 1 e 3) siano uguali non è
soddisfatta.
Il modello di AOV a misure ripetute potrebbe produrre una stima distorta della
significatività dell’effetto del tempo.
Analisi della varianza a misure ripetute
VALUTAZIONE DELL’IPOTESI DI SFERICITA’
Per valutare se i dati soddisfano l’ipotesi
di sfericità si può utilizzare il test di Mauchly
Il test di Mauchly
è significativo (p<0.05) ?
No
I dati soddisfano l’assunzione di sfercità.
La stima degli effetti non è distorta.
Sì
I dati non soddisfano l’ipotesi di sfericità.
Per ottenere una stima non distorta degli
effetti si deve ricorrere a dei criteri di
correzione (ad es. Greenhouse-Geisser)
Analisi della varianza a misure ripetute in SPSS
1. Selezionare il menù “Analizza”.
2. Selezionare l’opzione “Modello lineare generalizzato”.
3. Selezionare l’opzione “Misure Ripetute”.
4. Nella finestra “Definisci Fattori” inserire i nomi dei fattori within ed il
rispettivo numero di livelli. Cliccare “Definisci”.
5. Inserire le variabili within in modo appropriato rispetto le definizioni dei
fattori fatte al punto 4.
6. Cliccare OK!
Analisi della varianza a misure ripetute in SPSS
ESEMPIO PRATICO (IV)
Si supponga di voler studiare l’effetto di 4 diversi tipi di vino sui tempi di
reazione ad una particolare prova di abilità.
Nella conduzione dell’esperimento un tempo sufficiente viene fatto
trascorrere tra una prova e l’altra, in modo da minimizzare gli effetti della
“somministrazione” di un tipo di vino sui tempi di reazione legati alla
“successiva somministrazione” (Winer, 1971).
Nota: i dati sono contenuti nel file “vini.sav”
Analisi della varianza a misure ripetute in SPSS
IL MODELLO DI ANLISI
Per valutare se il tipo di vino ha un effetto sui tempi di reazione dei soggetti si
adotterà un modello di analisi della varianza a misure ripetute con:
- variabile dipendente: il Tempo di Reazione dei soggetti;
- un fattore entro-soggetti a 4 livelli: Tipo di Vino (Chianti, Merlot,
Prosecco, Zibibbo).
Analisi della varianza a misure ripetute in SPSS
ANALISI DESCRITTIVA DEI DATI
Confronto dei tempi di reazione medi ottenuti per tipo di vino
45
40
media dei tempi di reazione
35
30
25
20
15
10
5
0
chianti
merlot
prosecco
tipo di vino
zibibbo
Analisi della varianza a misure ripetute in SPSS
CONTROLLO DELL’IPOTESI DI SFERICITA’
Test di sfericità di Mauchly
b
Misura: MEASURE_1
Effetto entro soggetti
tipo_v
W di Mauchly
.186
Approssimaz
ione
chi-quadrato
4.572
Epsilon
df
5
Sig.
.495
Greenhous
e-Geisser
.605
a
Huynh-Feldt
1.000
Verifica l'ipotesi nulla per la quale la matrice di covarianza dell'errore della variabile dipendente trasformata ortonormalizzata
è proporzionale a una matrice identità.
a. È possibile utilizzarlo per regolare i gradi di libertà per i test di significatività mediati. I test corretti vengono
visualizzati nella tabella dei test sugli effetti entro soggetti.
b.
Disegno: Intercept
Disegno entro soggetti: tipo_v
L’ipotesi di sfericità è soddisfatta.
Limite
inferiore
.333
Analisi della varianza a misure ripetute in SPSS
RISULTATI DELL’ANALISI DELLA VARIANZA A MISURE RIPETUTE
Test degli effetti entro soggetti
Misura: MEASURE_1
Sorgente
tipo_v
Errore(tipo_v)
Assumendo la sfericità
Greenhouse-Geisser
Huynh-Feldt
Limite inferiore
Assumendo la sfericità
Greenhouse-Geisser
Huynh-Feldt
Limite inferiore
Somma dei
quadrati
Tipo III
698.200
698.200
698.200
698.200
112.800
112.800
112.800
112.800
df
3
1.815
3.000
1.000
12
7.258
12.000
4.000
Media dei
quadrati
232.733
384.763
232.733
698.200
9.400
15.540
9.400
28.200
F
24.759
24.759
24.759
24.759
Il fattore within Tipo di Vino ha un effetto
statisticamente significativo.
Sig.
.000
.001
.000
.008
Analisi della varianza a misure ripetute in SPSS
CONCLUSIONI
Il fattore Tipo di Vino ha un effetto statisticamente significativo sui tempi di
reazione dei soggetti (F3,12= 24.759 ; p<0.05).
Si può quindi concludere che a seconda del tipo di vino somministrato i tempi
di reazione dei soggetti variano.
Analisi della varianza con
Disegno Misto
COSA SI INTENDE PER “ANALISI DELLA VARIANZA CON DISEGNO
MISTO?”
Un modello analisi della varianza con disegno misto è un modello che
comprende sia fattori between che fattori within.
Analisi della varianza con
Disegno Misto
ESEMPIO DI UN PROBLEMA RISOLVIBILE ATTRAVERSO UN AOV
CON DISEGNO MISTO
Si supponga di voler misurare l’effetto di tre diversi trattamenti somministrati
ad un campione comprendente maschi e femmine.
La situazione può essere così rappresentata:
TRATTAMENTI
A
B
C
Maschi
Femmine
Analisi della varianza con
Disegno Misto
LE DOMANDE DI RICERCA
Esiste un effetto trattamento?
Effetto principale
del fattore within
Complessivamente i soggetti rispondono in maniera diversa
a seconda del trattamento?
Esiste un effetto genere?
Effetto principale
del fattore
between
Interazione tra
fattore within e
between
Complessivamente i maschi rispondono in maniera diversa
rispetto alle femmine?
Esistono dei legami tra il tipo di trattamento e il genere
dei soggetti?
Le differenze tra i maschi e le femmine sono costanti o
variano a seconda del tipo di trattamento?
Analisi della varianza con
Disegno Misto
IL MODELLO DI ANALISI
Il modello da adattare ai dati sarà un modello di analisi della varianza a
disegno misto 3×2 con:
• variabile dipendente: le risposte dei soggetti
• un fattore within a 3 livelli: trattamento (A, B, C)
• un fattore between a 2 livelli: sesso (Maschi vs. Femmine)
Analisi della varianza con Disegno Misto in SPSS
1. Selezionare il menù “Analizza”.
2. Selezionare l’opzione “Modello lineare generalizzato”.
3. Selezionare l’opzione “Misure Ripetute”.
4. Nella finestra “Definisci Fattori” inserire i nomi dei fattori within ed il
rispettivo numero di livelli. Cliccare “Definisci”.
5. Inserire le variabili within in modo appropriato rispetto le definizioni dei
fattori fatte al punto 4.
6. Selezionare i fattori between e le eventuali covariate.
7. Cliccare OK!
Analisi della varianza con Disegno Misto in SPSS
ESEMPIO PRATICO (V)
A due gruppi, uno sottoposto a una condizione stressante (gruppo
sperimentale) ed uno sottoposto ad una condizione neutra (gruppo di
controllo), vengono letti tre brani di crescente difficoltà.
Dopo la lettura di ciascun brano vengono poste ai soggetti 10 domande di
comprensione del testo e viene rilevato il numero di risposte corrette.
Si vogliono studiare i seguenti aspetti:
• la difficoltà dei brani ha un effetto sul numero di risposte corrette?
• il gruppo sottoposto ad una condizione di stress risponde complessivamente in
maniera diversa rispetto al gruppo di controllo?
• esiste un’interazione tra la difficoltà dei brani ed il livello di stress (le differenze
tra i due gruppi sono costanti per i tre livelli di difficoltà dei brani)?
Nota: i dati sono contenuti nel file “stress.sav”
Analisi della varianza con Disegno Misto in SPSS
IL MODELLO DI ANLISI
Il modello da applicare sarà un modello di analisi della varianza a disegno
misto 3×2 con:
• variabile dipendente: il numero di risposte corrette
• un fattore within a 3 livelli: difficoltà del brano (1,2,3)
• un fattore between a 2 livelli: gruppo (sperimentale vs. controllo)
Analisi della varianza con Disegno Misto in SPSS
CONTROLLO DELL’IPOTESI DI SFERICITA’
Test di sfericità di Mauchly b
Misura: MEASURE_1
Effetto entro soggetti
difficol
W di Mauchly
.673
Approssima
zione
chi-quadrato
6.733
df
2
Sig.
.035
La sfericità non è
soddisfatta. Bisognerà
adottare un criterio
correttivo.
Analisi della varianza con Disegno Misto in SPSS
RISULTATI DELL’ANALISI DELLA VARIANZA CON DISEGNO MISTO
Effetto
siginificativo del
fattore within.
Effetto
siginificativo
dell’interazione
tra il fattore within
e quello between
Analisi della varianza con Disegno Misto in SPSS
RISULTATI DELL’ANALISI DELLA VARIANZA CON DISEGNO MISTO
Effetto
significativo del
fattore between.
Analisi della varianza con Disegno Misto in SPSS
INTERPRETAZIONE GRAFICA DEI RISULTATI
Analisi della varianza con Disegno Misto in SPSS
CONCLUSIONI
L’analisi condotta ha messo in evidenza i seguenti aspetti:
• emerge un effetto significativo del fattore within “difficoltà” (F1.507,27.129=20.028 ;
p<0.05);
• emerge un effetto significativo del fattore between “gruppo” (F1.507,27.129=5.861 ;
p<0.05);
• emerge un effetto significativo dell’interazione tra il fattore within e il fattore
within (F1,18=9.227 ; p<0.05).
Si può quindi concludere che:
• la difficoltà del brano influenza il numero di risposte corrette;
• i due gruppi differiscono sulla base del numero di riposte corrette;
• le differenze tra i due gruppi non sono costanti per i tre livelli di difficoltà dei
brani; in particolare si può notare che nella condizione “alta difficoltà” dei brani, la
differenza tra i due gruppi è molto maggiore rispetto a quelle che si registrano
nelle condizioni “media e bassa difficoltà”.
Analisi della varianza
COSA FARE QUANDO LE ASSUNZIONI PER L’ANALISI DELLA
VARIANZA NON SONO SODDISFATTE?
Se le assunzioni per l’analisi della varianza non sono soddisfatte, cioè ad
esempio:
• la variabile dipendente non è quantitativa ma è su scala ordinale;
• la variabile dipendente non è distribuita normalmente;
• la numerosità campionaria è ridotta.
E’ POSSIBILE ADOTTARE UN APPROCCIO NON PARAMETRICO
I vantaggi dell’approccio Nonparametrico
Le tecniche non-parametriche, che si basano sui ranghi e non sui valori
originali come le tecniche parametriche, presentano i seguenti principali
vantaggi:
sono “distribution-free”, cioè indipendenti dalla distribuzione campionaria
della variabile dipendente;
sono particolarmente indicate nei casi di ridotta numerosità campionaria.
Alternative Non-parametriche
all’analisi della varianza con fattore
between
NUMERO DI
LIVELLI DEL
FATTORE
BETWEEN
ANALISI
PARAMETRICA
ANALISI
NONPARAMETRICA
due
test t per
campioni
indipendenti
test
di Mann-Whitney
due
o più di due
analisi della
varianza ad un
fattore between
test
di Kruskal-Wallis
Alternative Non-parametriche
all’analisi della varianza a misure
ripetute con fattore within
NUMERO DI
LIVELLI DEL
FATTORE WITHIN
ANALISI
PARAMETRICA
ANALISI
NONPARAMETRICA
due
test t per
campioni
appaiati
test
di Wilcoxon
due
o più di due
analisi della
varianza a
misure ripetute
test
di Friedman
Alternative Non-parametriche all’analisi della
varianza a misure ripetute con fattore within
(variabile dipendente dicotomica)
NUMERO DI
LIVELLI DEL
FATTORE WITHIN
due
due
o più di due
ANALISI
PARAMETRICA
ANALISI
NONPARAMETRICA
-
test
di McNemar
-
test
di Cochran
L’approccio Non-parametrico in SPSS
1. Selezionare il menù “Analizza”.
2. Selezionare l’opzione “Test non parametrici”.
3. Selezionare l’opzione che si intende utilizzare.
4. Selezionare le variabili di interesse in modo appropriato.
5. Cliccare OK!
“Mi conviene usare le tecniche
parametriche o quelle non
parametriche?”
Quando le assunzioni per l’analisi della varianza sono soddisfatte, l’approccio
parametrico è più “potente” (migliore) di quello non-parametrico.
Nel caso in cui le assunzioni per l’analisi della varianza sono dubbie, è
conveniente utilizzare sia l’approccio parametrico che quello nonparametrico e confrontare i risultati.
Per approfondimenti
Per approfondire le tecniche di Analisi della Varianza si consigliano i seguenti
testi:
“Using Multivariate Statistics” (5th edition) – Barbara G. Tabachnick &
Linda S. Fidell, 2007 – Pearson Education
“Applied Multivariate Statistics For The Social Sciences, Fourth
Edition” – James P. Stevens, 2002 – LEA, Publishers