Analisi delle medie (post ANOVA)
AMD
Marcello Gallucci
[email protected]
Lezione: 9
Problema
Se il test F è significativo, concludiamo che esiste una differenza fra le
medie dei gruppi
Ciò vuol dire che almeno due medie sono differenti, ma non
necessariamente che tutte le medie sono differenti
Chiameremo questo effetto Effetto principale (main effect)
Ci manca di sapere dove esattamente sono queste differenze
Disegni Fattoriali
Nelle maggior parte delle applicazioni di ricerca, il disegno di
ricerca prevede piu’ variabili indipendenti incrociate
Disegno fattoriale 3 (livello di stress) X 2 (genere)
Genere
Maschi
Femmine
Variabile
Controllo
G1
G2
Sperimentale
Stress Emotivo
G3
G4
Stress Cognitivo
G5
G6
Nei disegni fattoriali ogni gruppo di partecipanti
rappresenta una combinazioni di livelli delle
variabili indipendenti
Soluzione
Analisi dei contrasti
• Se abbiamo ipotesi specifiche da testare riguardanti gruppi di medie
Test post-hoc
• Se volgiamo confrontare tutte le medie con tutte le altre
Metodo dei contrasti
(trend analysis ed altro)
Medie
Guardo i dati: guardando il grafico delle medie, capisco casa accade
alla proporzione di errori per i diversi
carichi
Quali medie
sonocognitivi
diverse fra loro?
Come cambiano le medie all’aumentare del carico
Livello di
stress
cognitivo
Contrasti
Consideriamo l’effetto principale di condizione
Controllo è diverso da Emotivo?
Contrasti
Consideriamo l’effetto principale di condizione
Controllo è diverso da stress (Emotivo e
Cognitivo)?
Costruire un contrasto
Un contrasto è un set di coefficienti (pesi) che specificano un’ipotesi nulla
che volgiamo rifiutare
Controllo è diverso da Emotivo?
Controllo è diverso da stress (Emotivo e Cognitivo)?
1)
2)
Scriviamo tale relazione in modo tale che se le medie fossero tutte uguali
(l’ipotesi nulla), la somma delle medie sarebbe zero.
CONT −EMOT =0
EMOT + COGN
CONT −
=0
2
I coefficienti dei contrasti sono semplicemente i numeri che moltiplicano le medie
nella nostra ipotesi
Cont1
CONT
EMOT
COGN
1
-1
0
Cont2
CONT
EMOT
COGN
1
-1/2
-1/2
Contrasti in generale
In generale possiamo usare qualunque peso purchè descriva
un’ipostesi nulla
2
1.5
1
L= (−3 −1 0 1 3 )
0.5
0
-0.5
White Green
Red
Yellow
Blue
Linear
C
C=( −1 −1 0 1 1 )
-1
-1.5
-2
I pesi sommano sempre a zero
Contrasti Polinomiali
I contrasti polinomiali sono un set di pesi noto in quanto
sono ortogonali fra loro e studiano il trend delle medie
3
L= (−3 −1 1 3 )
2
Q=(−1 1 1 −1 )
1
0
C=( −1 1 −1 1 )
-1
-2
-3
White
Green
Red
Yellow
Linear
Quadratic
Cubic
Contrasti Polinomiali
Cioè ogni polinomio (contrast risponde ad una domanda)
3
L= (−3 −1 1 3 )
2
Q=(−1 1 1 −1 )
1
0
C=( −1 1 −1 1 )
-1
-2
-3
ieri
oggi
domani
dopo
Contrasti Polinomiali
Cioè ogni polinomio (contrast risponde ad uan domanda)
Lineare
3
L= (−3 −1 1 3 )
2
Q=(−1 1 1 −1 )
1
0
C=( −1 1 −1 1 )
-1
-2
-3
ieri
oggi
domani
dopo
C’è una tendenza nel trend a salire?
Contrasti Polinomiali
Cioè ogni polinomio (contrast risponde ad uan domanda)
3
Quadratico
L= (−3 −1 1 3 )
2
Q=(−1 1 1 −1 )
1
0
C=( −1 1 −1 1 )
-1
-2
-3
ieri
oggi
domani
dopo
C’è una tendenza nel trend ad
incurvarsi?
Contrasti Polinomiali
Cioè ogni polinomio (contrast risponde ad uan domanda)
3
L= (−3 −1 1 3 )
2
Q=(−1 1 1 −1 )
Cubico
1
0
C=( −1 1 −1 1 )
-1
-2
-3
ieri
oggi
domani
dopo
C’è una tendenza nel trend ad
incurvarsi in direzioni diverse?
Contrasti Polinomiali
L’insieme dei contrasti spiega (per quanto possibile nei dati) il trend
osservato nei dati
3
L= (−3 −1 1 3 )
2
1
Q=(−1 1 1 −1 )
0
C=( −1 1 −1 1 )
-1
-2
-3
ieri
oggi
domani
dopo
Effect sizes
Varianza
Within
Y
C
Y
Contrasto
Effetto
Principale
Varianza
B
Eta-quadro
Prendiamo la Fcontrast=
MS contrast
MS within
Interpretazione:
C
La varianza spiegata dal
contrasto dopo aver eliminato
Y
tutta la varianza spiegata dal
resto del modello
effect size=Eta quadro
r
2
contrast
=
F contrast
F contrast + df within
= pr 2 = pη 2
Contrasti ortogonali
Si preferisce utilizzare contrasti ortogonali fra loro (non correlati)
Il test dell’ipotesi inerente al contrasto non influenza il
test degli altri contrasti
Non c’è sovrapposizione di varianza con altri contrasti
Il pattern di medie viene decomposto in maniera chiara
Contrasti ortogonali
Due contrasti sono ortogonali se la somma dei prodotti dei loro pesi è
zero
Ortogonali
Gruppo
Linear
1
2
3
4
Quadro
-3
-1
1
3
prodotto
-1
1
1
-1
somma
3
-1
1
-3
0
Non ortogonali
Gruppo
Linear
1
2
3
4
Nuovo
-3
-1
1
3
prodotto
0
-2
1
1
somma
0
2
1
3
6
Contrasti ortogonali
L’idea che si possano stimare solo contrasti ortogonali è sbagliata
I contrasti ortogonali sono più comodi da interpretare
Ma qualunque set di contrasti che esauriscono i gradi di
libertà dell’effetto pricipale sono stimabili
Purchè siano fra loro non correlati 1
E la somma dei pesi sia 0 in ogni contrasto
Esempio dati
Disegno di ricerca: Abbiamo un esperimento in cui un tre set di parole
vengono somministrate ad un campione in sequenza (1 2 3 e 4) sotto
nel tempo. Si vuole stabilire se vi sia un peggioramento della
performance mnemonica (misurata in proporzione di errori)
Esempio
Risultati: Abbiamo un effetto significativo del fattore tempo, ora
vogliamo stabilire la forma dell’andamento delle medie nel tempo
Esempio
SPSS default: SPSS fornisce automaticamente i contrasti polinomiali
Come li interpretiamo
Esempio
SPSS default: SPSS fornisce automaticamente i contrasti polinomiali
Se il trend lineare è significativo, le medie
tendono ad aumentare (diminuire nel
tempo)
Esempio
SPSS default: SPSS fornisce automaticamente i contrasti polinomiali
Se il trend quadratico è significativo, le
medie tendono ad aumentare prima e
diminuire dopo
Esempio
SPSS default: SPSS fornisce automaticamente i contrasti polinomiali
Se il trend cubico è significativo, il grafico
delle medie contiene una parte a forma di S
Interpretazione alternativa
Ricordando i persi:
L= (−3 −1 1 3 )
Q=(−1 1 1 −1 )
C=( −1 1 −1 1 )
I contrasti si possono anche interpretare
non in base al tempo, ma in base alle
misure confrontate
Interpretazione alternativa
Ricordando i persi:
Lineare
I contrasti si possono anche interpretare
non in base al tempo, ma in base alle
misure confrontate
L= (−3 −1 1 3 )
In media, abbiamo che per ogni tempo in
più le medie aumentano?
Interpretazione alternativa
Ricordando i persi:
Quadratico
I contrasti si possono anche interpretare
non in base al tempo, ma in base alle
misure confrontate
Q=(−1 1 1 −1 )
In media, le medie T1+T4 sono diverse da
T2+T3
Interpretazione alternativa
Ricordando i persi:
Cubico
I contrasti si possono anche interpretare
non in base al tempo, ma in base alle
misure confrontate
Q   1 1 1 1
In media, le medie T1+T3 sono diverse da
T2+T4
Test post hoc
Esempio
Consideriamo il seguente esperimento: Abbiamo preparato una campagna
pubblicitaria utilizzando due testimonial: Un presentatore ed una soubrette.
Abbiamo mostrato gli spot con uno dei due testimonial o senza testimonial a tre
campioni di 30 tester (soggetti). Vogliamo stabilire se il gradimento del prodotto
sia diverso a seconda dei testimonial, e se i due testimonial hanno avuto lo stesso
Testimonial
impatto
Validi
Gradimento misurato con
una scala da 1 a 5
Nessuno
Conduttore
Soubrette
Totale
Statistiche descrittive
N
gradimento
Validi (listwise)
90
90
Minimo
1,00
Massimo
4,00
Media
2,2556
Deviazione
std.
,90642
Frequenza
30
30
30
90
Percentuale
33,3
33,3
33,3
100,0
Percentuale
valida
33,3
33,3
33,3
100,0
Percentuale
cumulata
33,3
66,7
100,0
Esempio: Risultati
Vogliamo stabilire se il gradimento del prodotto sia diverso per
soggetti che sono stati esposti a diversi testimonial o nessun testimonial
Risultati
3,00
2,50
gradimento
Testimonial
Nessuno
Conduttore
Soubrette
Totale
Media
1,9333
2,5333
2,3000
2,2556
N
30
30
30
90
Deviazione
std.
,90719
,89955
,83666
,90642
Media gradimento
Report
2,00
1,50
1,00
0,50
Vogliamo stabilire se c’è
un effetto testimonial
0,00
Nessuno
Conduttore
Testimonial
Soubrette
Esempio: ANOVA
Conduciamo una ANOVA con gradimento come VD e campagna
(1=nessun testimonial, 2=conduttore, 3=soubrette) come VI
Test degli effetti fra soggetti
Variabile dipendente: gradimento
df
2
1
2
87
90
89
Media dei
quadrati
2,744
457,878
2,744
,777
F
3,530
588,990
3,530
Sig. 2,50
,034
,000
2,00
,034
a. R quadrato = ,075 (R quadrato corretto = ,054)
Troviamo un effetto principale significativo
di “campagna”, dunque c’è stato un
effetto
Media gradimento
Sorgente
Modello corretto
Intercetta
campagna
Errore
Totale
Totale corretto
Somma dei
quadrati
Tipo III
5,489a
457,878
5,489
67,633
531,000
73,122
3,00
1,50
1,00
0,50
0,00
Nessuno
Conduttore
Testimonial
Soubrette
Esempio: ANOVA
Conduciamo una ANOVA con gradimento come VD e campagna
(1=nessun testimonial, 2=conduttore, 3=soubrette) come VI
3,00
conduttore e soubrette
sono differenti?
Media gradimento
2,50
2,00
1,50
1,00
Ispezionando le medie notiamo che
conduttore e soubrette sembrano aver
alzato il gradimento
0,50
0,00
Nessuno
Conduttore
Soubrette
Testimonial
soubrette è differente da
nessun testimonial?
Confronti a due a due
Per rispondere a queste domande, dobbiamo confrontare le
medie a due a due, e verificare quali sono le medie
significativamente diverse
3,00
conduttore e soubrette
sono differenti?
Media gradimento
2,50
2,00
1,50
1,00
Ispezionando le medie notiamo che
conduttore e soubrette sembrano aver
alzato il gradimento
0,50
0,00
Nessuno
Conduttore
Soubrette
Testimonial
soubrette è differente da
nessun testimonial?
Confronti Post-Hoc
I confronti post-hoc (a posteriori) servono a trovare le differenze tra i
gruppi, presi a due a due.
Ipotesi nulla ANOVA
3,00
H 0 : μ1 =μ 2=μ 3
H 01 : μ1 =μ 2
H 02 : μ1 =μ3
H 03 : μ 2=μ 3
Media gradimento
Ipotesi nulle Post-Hoc
2,50
2,00
H02
1,50
1,00
H01
0,50
H03
0,00
Nessuno
Conduttore
Testimonial
Scriviamo le medie come  (mu) in quanto l’ipotesi riguarda la popolazione
Soubrette
Confronti Post-Hoc: SPSS
Esistono decine di confronti post-hoc!!!
Clicco qui
Finestra ANOVA
Tutti, in una maniera o in un’altra, cercano di
testare le differenze tra le medie a due a due
Noi usiamo “Tukey” e “REGWG”
Finestra Post-Hoc
Confronti Post-Hoc: Output
A seconda del confronto post-hoc, otteniamo due tipi di
Confronti multipli
output
Confronti multipli
Variabile dipendente: gradimento
HSD di Tukey
(I) Testimonial
Nessuno
Conduttore
Soubrette
gradimento
HSD di Tukeya,b
Ryan-Einot-Gabrielb
Welsch (Intervallo)
Testimonial
Nessuno
Soubrette
Conduttore
Sig.
Nessuno
Soubrette
Conduttore
Sig.
Differenza fra
medie (I-J)
Errore std.
-,6000*
,22765
-,3667
,22765
,6000*
,22765
,2333
,22765
,3667
,22765
-,2333
,22765
Basato sulle medie osservate.
N
30
30
30
30
30
30
*. La differenza fra medie è significativa al livello ,05.
Sottoinsieme
1
2
1,9333
2,3000
2,3000
2,5333
,247
,563
1,9333
2,3000
2,3000
2,5333
,111
,308
Sono visualizzate le medie per i gruppi di sottoinsiemi omogenei.
Basato sulla somma dei quadrati Tipo III
Il termine di errore è Media dei quadrati(Errore) = ,777.
a. Utilizza dimensione campionaria media armonica = 30,000
b. Alfa = ,05
(J) Testimonial
Conduttore
Soubrette
Nessuno
Soubrette
Nessuno
Conduttore
Sottoinsiemi Omogenei
Sig.
,027
,247
,027
,563
,247
,563
Intervallo di confidenza
95%
Limite
Limite
inferiore
superiore
-1,1428
-,0572
-,9095
,1762
,0572
1,1428
-,3095
,7762
-,1762
,9095
-,7762
,3095
Confronti Post-Hoc: Confronti multipli
Nei confronti multipli ogni gruppo è testato per le
differenze con ogni altro
Confronti multipli
Significatività
Nessuno è differente da
conduttore?
Significatività
Soubrette è diversa da
conduttore?
Confronti Post-Hoc: Sottoinsiemi Omogenei
I sottoinsiemi omogenei ci indicano quali gruppi hanno
medie non statisticamente differenti
Sottoinsiemi Omogenei
Nessuno e soubrette non
sono differenti
Soubrette e conduttore
non sono differenti
Confronti Post-Hoc: Output
Entrambi gli output ci indicano che l’effetto principale di “campagna”
è dovuto alle differenze tra i gruppi con Conduttore e Nessun testimonial,
mentre l’effetto della Soubrette non sembra essere significativamente
diverso dagli altri
Confronti multipli
Variabile dipendente: gradimento
HSD di Tukey
(I) Testimonial
Nessuno
Conduttore
Soubrette
(J) Testimonial
Conduttore
Soubrette
Nessuno
Soubrette
Nessuno
Conduttore
Differenza fra
medie (I-J)
Errore std.
-,6000*
,22765
-,3667
,22765
,6000*
,22765
,2333
,22765
,3667
,22765
-,2333
,22765
Basato sulle medie osservate.
*. La differenza fra medie è significativa al livello ,05.
Sig.
,027
,247
,027
HSD
di
,563
,247
,563
Intervallo di confidenza
95%
Limite
Limite
gradimento
inferiore
superiore
-1,1428
-,0572
-,9095
,1762
Testimonial
N
,0572
1,1428
a,b
Tukey
Nessuno
-,3095
,7762
Soubrette
-,1762
,9095
Conduttore
-,7762
,3095
Ryan-Einot-Gabrielb
Welsch (Intervallo)
Sig.
Nessuno
Soubrette
Conduttore
Sig.
30
30
30
30
30
30
Sottoinsieme
1
2
1,9333
2,3000
2,3000
2,5333
,247
,563
1,9333
2,3000
2,3000
2,5333
,111
,308
Sono visualizzate le medie per i gruppi di sottoinsiemi omogenei.
Basato sulla somma dei quadrati Tipo III
Il termine di errore è Media dei quadrati(Errore) = ,777.
a. Utilizza dimensione campionaria media armonica = 30,000
b. Alfa = ,05
Confronti Post-Hoc: Domanda
In generale, non siamo interessati ai calcoli specifici di ogni
confronto post-hoc.
In pratica ci basta capire come interpretarli
Vogliamo ora capire perchè non possiamo semplicemente
fare tutti i confronti usando dei semplici t-test
Capitalizzazione sul Caso
Ricordiamo che quando facciamo un test inferenziale
stimiamo la probabilità di commettere un errore rifiutando
l’ipotesi nulla quando è vera
VALORE-P
Il valore p indica il rischio che noi prendiamo quando
affermiamo che l’ipotesi nulla è falsa
Probabilità p
Se l’ipotesi nulla è falsa, ci
abbiamo azzeccato
Se l’ipotesi nulla è vera, abbiamo
commesso un errore, detto del Tipo I
-2
-1
0
1
2
Il problema del caso
Se l’ipotesi nulla è vera (non ci sono realmente delle differenze) e
rifiutiamo l’ipotesi nulla ogni volta che p<.05 (alpha critico), alla lunga
commettiamo il 5% di errore
Il 5% va bene, di più no!
Ciò è equivalente alla situazione in cui compriamo un biglietto di una
lotteria in cui ci sono 20 numeri in totale. Un numero su 20 esce, ogni
biglietto ha un numero. Abbiamo il 5% di probabilità di essere estratti e
95% di non essere estratti
Se il biglietto è estratto, le nostre conclusioni sono sbagliate!
Estrazioni multiple
Cosa succede se partecipiamo a due estrazioni
La probabilità di essere estratto aumenta! Più estrazioni si fanno, più
aumenta la probabilità di essere estratti
Cioè, anche se il biglietto ha il 5% di chance di essere estratto in una
estrazione, facendo varie estrazioni la probabilità di essere estratto
aumenterà
In maniera equivalente, più test facciamo, più aumenta la probabilità di
rifiutare l’ipotesi nulla anche se essa è vera
Cioè aumenta la probabilità di sbagliare.
Test multipli
A seconda di quanti test facciamo, la probabilità di ottenere
almeno una differenza significativa per caso
p. Nessun test
significativo
Criterio usato
Un test solo
ns=. 95
α=.05
Due test
Tre test
p. Almeno uno
significativo
α vero=.05
ns=. 95⋅. 95=. 9025
α vero=1−. 9025=. 09275
3
 vero  1  .8573  .1423
ns=. 95 =. 8573
Test multipli
In generale, facendo K test, se rifiutiamo l’ipotesi nulla per
p<.05, il nostro errore diventa sempre maggiore e maggiore
di 0.05
Criterio usato
α=.05
α=C
p. Nessun test
significativo
ns k =. 95
ns k =C
k
k
p. di errore
α vero=1−. 95
α vero=1−C
k
k
Confronti post-hoc
In generale, i vari confronti post-hoc cercano di calcolare le
probabilità associate ai vari confronti in modo tale che
p. di errore
 vero  1  C  0.05  
k
Cioè cercando di fissare la probabilità di
ottenere almeno un test significativo
quando la differenze sono 0, uguale a
quella di come se facessimo un test solo
In pratica, i vari test post-hoc usano vari
espedienti per controllare questa
probabilità ai valori corretti
Fine
Fine della Lezione IX