Anova a 2 vie con repliche (( chiarire che non devono essere

Anova a 2 vie con repliche (( chiarire che non devono essere esattamente nello stesso numero
per ogni cella ovvero per le ripetizioni dei de fattori ma che excel li legge così)
Esercizio-esempio 1
Il valore nutritivo in Kj di un certo frutto commestibile è stato valutato in un insieme di 72
esemplari suddiviso in quattro varietà diverse provenienti da tre zone geografiche distinte. Ogni
varietà e zona specifiche hanno fornito un campione di 6 esemplari. I risultati sono riportati nella
tabella sottostante. Valutare le differenze tra medie delle varietà, zone geografiche e l’interazione
dei due fattori varietà-zona geografica. Sia alfa = 0.05 per tutti i test.
VARIETÀ
zona geografica
Nord
Centro
Sud
A
B
C
D
6.9
11.8
6.2
9.2
9.2
6.2
8.9
9.2
5.2
7.7
7.8
5.7
6.8
5.2
5
5.2
5.5
7.3
11
7.8
7.3
9.1
7.9
6.9
5.8
5.1
5
9.4
8.3
5.7
7.8
6.5
7
9.3
6.6
10.8
13.1
12.1
9.9
12.4
11.3
11
12.1
7.1
13
13.7
12.9
7.5
8.7
10.5
10
8.1
10.6
10.5
13.4
14.1
13.5
13
12.3
13.7
9.1
13.1
13.2
8.6
9.8
9.9
11.8
13.5
14
10.8
12.3
14
Var risposta= valore nutritivo in Kj
Var trattamento 1 = colonne – varietà diverse
Var trattamento 2 = zone diverse
Interazione = varietà diversa x zona diversa
Unità sperimentali = singole misurazioni- frutti ripetute per varietà e zona
H0 α : α1 = α 2= … α i = 0 gli effetti del trattamento A colonna sono uguali e nulli;
HA α: non tutti gli α i = 0
------------------------------------------------H0 β : β1= β 2…. βj = 0 gli effetti del trattamento B riga sono uguali e nulli;
HA β: non tutti gli βj = 0
--------------------------------------------------H0 α β : α1 β1= α1 β 2… = α β ij = 0 gli effetti della interazione AB sono uguali e nulli;
HA α β: non tutti gli α β ij = 0
Numero trattamenti A colonne = k=4; numero trattamenti B righe B = j =3
Numero ripetizioni per interazione trattamento A x trattamento B = n = 6
Gradi di libertà totali =(k*j*n)-1= (4*3*6) -1 = 72-1= 71
Gradi di libertà tra trattamenti A -colonne = k-1 = 4-1= 3
Gradi di libertà tra trattamenti B -righe = j-1 = 3-1 = 2
Gradi di libertà della interazione =( k-1) (j-1)= 3*2 =6
Gradi di libertà della variazione residua-errore =k*j*(n-1)= 4*3*(6-1)= 60
F critico per RV trattamento A colonne : alfa= 0.05, 3 gdl al numeratore / 60 gdl al denominatore = 2.76
F critico per RV trattamento B righe: alfa= 0.05, 2 gdl al numeratore / 60 gdl al denominatore =3.15
F critico per RV interazione fattori colonne-righe: alfa= 0.05, 6 gdl al numeratore / 60 gdl al denominatore = 2.25
ANALISI VARIANZA
Analisi
Dati
Excel
F
5.478780443
37.74306931
1.922834169
Origine della variazione
SQ
gdl
MQ
Campione-Righe-Zone
Colonne-Varietà
Interazione
residuo
31.50694444
325.5748611
33.17305556
172.5216667
2
3
6
60
15.75347
108.525
5.528843
2.875361
Totale
562.7765278
71
Valore di significatività
F crit
0.00652495
7.82751E-14
0.091675558
3.150411
2.758078
2.254055
Quindi rifiuto H0 α, rifiuto H0 β, non rifiuto H0 α β.
Accetto le rispettive HA α e HA β e H0 α β.
I risultati indicano che sia le varietà del frutto che le zone di coltivazione hanno un effetto
significativo sulla valore nutritivo dello stesso, ma non l’interazione dei due fattori.
Con il programma STATA
-------------------------------------------------------------------------------anova varrisposta variet##zona
Number of obs =
72
Root MSE
= 1.69569
R-squared
=
Adj R-squared =
0.6934
0.6372
Source | Partial SS
df
MS
F
Prob > F
------------+---------------------------------------------------Model |
390.25487
11 35.4777155
12.34
0.0000
|
variet | 325.574872
3 108.524957
37.74
0.0000
zona | 31.5069453
2 15.7534726
5.48
0.0065
variet#zona | 33.1730526
6
5.5288421
1.92
0.0917
|
Residual | 172.521668
60 2.87536114
------------+---------------------------------------------------Total | 562.776538
71 7.92643012
---------------------------------------------------------------------------------------
I risultati sono uguali
Risoluzione esercizio con il software R (v2.15.1)
#Importazione dati
data_frutti<-read.csv2(file.choose(), header= TRUE, sep= ";", dec=",",
na.strings=" ") #importa dataset "anova2_1R.csv"
#Visualizzo un estratto del dataset
head(data_frutti)
> head(data_frutti)
zona risposta varietà
1
6.9
1
1
11.8
1
1
6.2
1
1
9.2
1
1
9.2
1
1
6.2
1
#Uso il comando ‘colnames’ che permette di visualizzare il nome delle variabili
colnames(data_frutti)
> colnames(data_frutti)
[1] "zona"
"risposta" "varietà"
#Utilizzo il comando ‘attach’ per gestire le variabili con il loro nome
attach(data_frutti)
#Comunico al software la natura nominale categorica delle variabili blocchi
zona<-as.factor(zona)
varietà<-as.factor(varietà)
#Calcolo le statistiche di sintesi della variabile risposta, della variabile
varietà e della variabile zona
summary(risposta)
> summary(risposta)
Min. 1st Qu. Median
5.000
7.075
9.200
Mean 3rd Qu.
9.457 12.100
Max.
14.100
summary(varietà)
> summary(varietà)
1 2 3 4
18 18 18 18
summary(zona)
> summary(zona)
1 2 3
24 24 24
#Applico l’analisi della varianza (ANOVA) a 2 vie con interazione
anova(lm(risposta~varietà+zona+varietà:zona))
> anova(lm(risposta~varietà+zona+varietà:zona))
Analysis of Variance Table
Response: risposta
Df Sum Sq Mean Sq F value
Pr(>F)
varietà
3 325.57 108.525 37.7431 7.828e-14
zona
2 31.51 15.753 5.4788 0.006525
varietà:zona 6 33.17
5.529 1.9228 0.091676
Residuals
60 172.52
2.875
--Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05
***
**
.
‘.’ 0.1 ‘ ’ 1
Esercizio-esempio 2
La tavola seguente riporta dei punteggi sulla maturità emotiva di 27 giovani maschi classificati
secondo l’età e secondo l’uso di marijuana. Valutare le differenze tra le medie per maturità emotiva
secondo i fattori A( uso di marijuana), B (età) e l’interazione dei due A*B.
Sia alfa = 0.05 per tutti i test.
Fattore A ( uso di marijuana)
Fattore B
(Età)
15-19
20-24
25-29
Mai
25
28
22
28
32
30
25
35
30
Occasionalmente
18
23
19
16
24
20
14
16
15
Giornalmente
17
24
19
18
22
20
10
8
12
Var risposta= punteggio maturità emotiva
Var trattamento A = colonne –uso di marijuana
Var trattamento B = righe- età
Interazione =uso marijuana x età
Unità sperimentali = singoli soggetti repliche per uso marijuana ed età
H0 α : α1 = α 2= … α i = 0 gli effetti del trattamento A colonna sono uguali e nulli;
HA α: non tutti gli α i = 0
------------------------------------------------H0 β : β1= β 2…. βj = 0 gli effetti del trattamento B riga sono uguali e nulli;
HA β: non tutti gli βj = 0
--------------------------------------------------H0 α β : α1 β1= α1 β 2… = α β ij = 0 gli effetti della interazione AB sono uguali e nulli;
HA α β: non tutti gli α β ij = 0
Numero trattamenti A colonne= k=3; numero trattamenti B righe = j =3
Numero ripetizioni per interazione trattamento A x trattamento B = n = 3
Gradi di libertà totali =(k*j*n)-1= (3*3*3) -1 = 27-1= 26
Gradi di libertà tra trattamenti A-colonne = k-1 = 3-1= 2
Gradi di libertà tra trattamenti B-righe = j-1 = 3-1 = 2
Gradi di libertà della interazione AB =( k-1) (j-1)= 2*2 =4
Gradi di libertà della variazione residua-errore =k*j*(n-1)= 3*3*(3-1)= 18
F critico per RV trattamento A: alfa= 0.05, 2 gdl al numeratore / 18 gdl al denominatore = 3.55
F critico per RV trattamento B: alfa= 0.05, 2 gdl al numeratore / 18 gdl al denominatore =3.55
F critico per RV interazione fattori AB colonne-righe: alfa= 0.05, 4 gdl al numeratore / 18 gdl denominatore = 2.93
Analisi varianza: a due fattori con replica
RIEPILOGO
15-19
Conteggio
Somma
Media
Varianza
3
75
25
9
3
60
20
7
3
9
60
195
20 21.66667
13
13.5
3
90
30
4
3
60
20
16
3
9
60
210
20 23.33333
4
31
3
90
30
25
3
45
15
1
3
9
30
165
10 18.33333
4
88.75
20-24
Conteggio
Somma
Media
Varianza
25-29
Conteggio
Somma
Media
Varianza
Totale
Conteggio
Somma
Media
Varianza
9
9
9
255
165
150
28.33333 18.33333 16.66667
15.75
12.25
30.25
ANALISI VARIANZA
Origine della variazione
Campione-righe-età
Colonne-uso marijuana
Interazione
Errore residuo
SQ
116.6667
716.6667
183.3333
166
gdl
2
2
4
18
Totale
1182.667
26
MQ
F
Valore di significatività F crit
58.33333 6.325301
0.008308
3.554561
358.3333 38.85542
2.94E-07
3.554561
45.83333 4.96988
0.007071
2.927749
9.222222
Quindi rifiuto H0 α, rifiuto H0 β, rifiuto H0 α β. Accetto le rispettive HA.
I risultati indicano che sia l’uso di marijuana sia l’età che l’interazione dei due fattori hanno un
effetto significativo sulla maturità emotiva. In particolare in presenza di interazione significativa
dei fattori, l’effetto dei singoli fattori viene subordinato a questa ultima, ovvero l’uso di
marijuana per età. Degno di nota è il valore di F e relativa significatività per il trattamento A uso di
marijuana che indicherebbe un effetto più forte per questo fattore.
…… Se osserviamo le medie della tabella riportata notiamo che effettivamente chi non fa mai uso
di marijuana nella età minore ha maturità emotiva più alta di chi fa uso giornaliero nella età
maggiore…… ulteriori valutazioni si rendono opportune per queste interazioni…...
Controlliamo anche con il programma STATA
. anova varrisposta usomarijuana##et
Number of obs =
27
Root MSE
= 3.03681
R-squared
=
Adj R-squared =
0.8596
0.7973
Source | Partial SS
df
MS
F
Prob > F
---------------+---------------------------------------------------Model | 1016.66667
8 127.083333
13.78
0.0000
|
usomariju~a | 716.666667
2 358.333333
38.86
0.0000
6.33
0.0083
et | 116.666667
2 58.3333333
usomariju~a#et | 183.333333
4 45.8333333
4.97
0.0071
|
Residual |
166
18 9.22222222
---------------+---------------------------------------------------Total | 1182.66667
26 45.4871795
Il risultato è uguale
Esercizio-esempio 3
Un esperimento in soggetti adolescenti è stato programmato per studiare gli effetti di tre farmaci
diversi in tre tipi di condizioni da stress, che procuravano ansia. La tavola riporta le differenze tra i
punteggi, pre – e post- trattamento dei 18 soggetti che hanno partecipato all’esperimento. Valutare
se esistono differenze per livelli diversi dei due fattori e la loro interazione.
Condizioni
da stress
(Fattore B)
Farmaco
(Fattore A)
A
B
C
I
4
5
1
3
1
0
II
6
6
6
6
6
3
III
5
4
7
4
4
5
Var risposta= effetto dei farmaci espresso in punteggio
Var trattamento A = colonne –tipo di farmaco
Var trattamento B = condizioni da stress
Interazione =tipo farmaco x condizioni da stress
Unità sperimentali = singoli adolescenti repliche per farmaco e condizioni da stress
H0 α : α1 = α 2= … α i = 0 gli effetti del trattamento A colonna sono uguali e nulli;
HA α: non tutti gli α i = 0
------------------------------------------------H0 β : β1= β 2…. βj = 0 gli effetti del trattamento B riga sono uguali e nulli;
HA β: non tutti gli βj = 0
--------------------------------------------------H0 α β : α1 β1= α1 β 2… = α β ij = 0 gli effetti della interazione AB sono uguali e nulli;
HA α β: non tutti gli α β ij = 0
Numero trattamenti A colonne= k=3; numero trattamenti B righe = j =3
Numero ripetizioni per interazione trattamento A x trattamento B = n = 2
Gradi di libertà totali =(k*j*n)-1= (3*3*2) -1 = 18-1= 17
Gradi di libertà tra trattamenti A -colonne = k-1 = 3-1= 2
Gradi di libertà tra trattamenti B -righe = j-1 = 3-1 = 2
Gradi di libertà della interazione AB =( k-1) (j-1)= 2*2 =4
Gradi di libertà della variazione residua-errore =k*j*(n-1)= 3*3*(2-1)= 9
F critico per RV trattamento A: alfa= 0.05, 2 gdl al numeratore / 9 gdl al denominatore = 4.26
F critico per RV trattamento B: alfa= 0.05, 2 gdl al numeratore / 9 gdl al denominatore =4.26
F critico per RV interazione fattori colonne-righe: alfa= 0.05, 4 gdl al numeratore / 9 gdl al denominatore = 3.63
Analisi varianza: a due fattori con replica
RIEPILOGO
A
B
C
Totale
2
9
4.5
0.5
2
4
2
2
2
1
0.5
0.5
6
14
2.333333
3.866667
2
12
6
0
2
12
6
0
2
9
4.5
4.5
6
33
5.5
1.5
2
2
9 11
4.5 5.5
0.5 4.5
2
9
4.5
0.5
6
29
4.833333
1.366667
6
6
30 27
5 4.5
0.8 5.1
6
19
3.166667
5.366667
Stress I
Conteggio
Somma
Media
Varianza
Stress II
Conteggio
Somma
Media
Varianza
Stress III
Conteggio
Somma
Media
Varianza
Totale
Conteggio
Somma
Media
Varianza
ANALISI VARIANZA
SQ
Origine della variazione
Campione-righe-stress 33.44444
Colonne-farmaco
10.77778
Interazione
9.888889
Residuo
13
Totale
67.11111
gdl
2
2
4
9
MQ
F
Valore di significatività F crit
16.72222 11.57692
0.003247
4.256492
5.388889 3.730769
0.066065
4.256492
2.472222 1.711538
0.230886
3.63309
1.444444
17
Quindi rifiuto H0 α, rifiuto H0 β, non rifiuto H0 α β.
Accetto le rispettive HA α e HA β e H0 α β.
I risultati indicano che sia il tipo di farmaco che le condizioni da stress danno risultati
significativamente sugli effetti del farmaco, ma non l’interazione dei due fattori. Lo stress inoltre
appare avere un effetto più forte rispetto al tipo di farmaco sulla variabile risposta.
Controlliamo anche con il programma STATA
anova varrisposta stress##farmaco
Number of obs =
18
Root MSE
= 1.20185
R-squared
=
Adj R-squared =
0.8063
0.6341
Source | Partial SS
df
MS
F
Prob > F
---------------+---------------------------------------------------Model | 54.1111111
8 6.76388889
4.68
0.0166
|
stress | 33.4444444
2 16.7222222
11.58
0.0032
farmaco | 10.7777778
2 5.38888889
3.73
0.0661
stress#farmaco | 9.88888889
4 2.47222222
1.71
0.2309
|
Residual |
13
9 1.44444444
---------------+---------------------------------------------------Total | 67.1111111
17 3.94771242
Il risultato è uguale
Esercizio-esempio 4
La seguente tavola riporta le misure sulla capacità vitale di 60 maschi adulti classificati secondo
l’età ed il tipo di lavoro. Valutare le differenze tra i tipi di lavoro, le classi d’età e l’interazione delle
due, alfa = 0.05
Tipo di lavoro
classe
età
1
2
3
A
4.31
4.89
4.05
4.44
4.59
4.13
4.61
3.91
4.52
4.43
3.79
4.17
4.47
4.35
3.59
B
4.68
6.18
4.48
4.23
5.92
3.41
3.64
3.32
3.51
3.75
4.63
4.59
4.9
5.31
4.81
C
4.17
3.77
5.2
5.28
4.44
3.89
3.64
4.18
4.48
4.27
5.81
5.2
5.34
5.94
5.56
D
5.75
5.7
5.53
5.97
5.52
4.58
5.21
5.5
5.18
4.15
6.89
6.18
6.21
7.56
6.73
Var risposta= capacità vitale
Var trattamento 1 = colonne – tipo di lavoro
Var trattamento 2 = righe -classi d’età
Interazione = tipo lavoro x classi età
Unità sperimentali = soggetti diversi repliche misurati per le combinazioni di lavoro e classe età
H0 α : α1 = α 2= … α i = 0 gli effetti del trattamento A colonna sono uguali e nulli;
HA α: non tutti gli α i = 0
------------------------------------------------H0 β : β1= β 2…. βj = 0 gli effetti del trattamento B riga sono uguali e nulli;
HA β: non tutti gli βj = 0
--------------------------------------------------H0 α β : α1 β1= α1 β 2… = α β ij = 0 gli effetti della interazione AB sono uguali e nulli;
HA α β: non tutti gli α β ij = 0
Numero trattamenti A colonne = k=4; numero trattamenti-blocchi righe B = j =3
Numero ripetizioni per interazione trattamento A x trattamento B = n = 5
Gradi di libertà totali =(k*j*n)-1= (4*3*5) -1 = 60-1= 59
Gradi di libertà tra trattamenti A -colonne = k-1 = 4-1= 3
Gradi di libertà tra trattamenti B – righe = j-1 = 3-1 = 2
Gradi di libertà della interazione AB=( k-1) (j-1)= 3*2 =6
Gradi di libertà della variazione residua-errore =k*j*(n-1)= 4*3*(5-1)= 48
F critico per RV trattamento A: alfa= 0.05, 3 gdl al numeratore / 48 gdl al denominatore = 2.80
F critico per RV trattamento B: alfa= 0.05, 2 gdl al numeratore / 48 gdl al denominatore =3.20
F critico per RV interazione AB fattori colonne-righe: alfa= 0.05, 6 gdl al numeratore / 48gdl al denominatore = 2.30
ANALISI VARIANZA
Origine della variazione
SQ
Campione
12.30879
Colonne
19.77855
Interazione
8.948863
In
10.05424
Totale
51.09044
gdl
2
3
6
48
MQ
F
Valore di significatività F crit
6.154395 29.38173
4.65E-09 3.190721
6.592849 31.47495
2.13E-11 2.79806
1.491477 7.120469
1.83E-05 2.294598
0.209463
59
Quindi rifiuto H0 α, rifiuto H0 β, rifiuto H0 α β. Accetto le rispettive HA.
I risultati indicano che sia il tipo di lavoro che l’età che l’interazione dei due fattori hanno un
effetto significativo sulla capacità vitale . In particolare in presenza di interazione significativa dei
fattori, l’effetto dei singoli fattori viene subordinato a questa ultima, ovvero il tipo di attività
lavorativa per la classe d’età.
Verifica con STATA
anova varrrisposta et##tipolavoro
Number of obs =
60
Root MSE
= .457672
R-squared
=
Adj R-squared =
0.8032
0.7581
Source | Partial SS
df
MS
F
Prob > F
--------------+---------------------------------------------------Model |
41.036198
11 3.73056346
17.81
0.0000
|
29.38
0.0000
et | 12.3087893
2 6.15439464
tipolavoro | 19.7785454
3 6.59284846
31.47
0.0000
et#tipolavoro | 8.94886338
6 1.49147723
7.12
0.0000
|
Residual | 10.0542389
48 .209463311
--------------+---------------------------------------------------Total | 51.0904369
59 .865939609
Il risultato è uguale