Anova a 2 vie con repliche (( chiarire che non devono essere esattamente nello stesso numero per ogni cella ovvero per le ripetizioni dei de fattori ma che excel li legge così) Esercizio-esempio 1 Il valore nutritivo in Kj di un certo frutto commestibile è stato valutato in un insieme di 72 esemplari suddiviso in quattro varietà diverse provenienti da tre zone geografiche distinte. Ogni varietà e zona specifiche hanno fornito un campione di 6 esemplari. I risultati sono riportati nella tabella sottostante. Valutare le differenze tra medie delle varietà, zone geografiche e l’interazione dei due fattori varietà-zona geografica. Sia alfa = 0.05 per tutti i test. VARIETÀ zona geografica Nord Centro Sud A B C D 6.9 11.8 6.2 9.2 9.2 6.2 8.9 9.2 5.2 7.7 7.8 5.7 6.8 5.2 5 5.2 5.5 7.3 11 7.8 7.3 9.1 7.9 6.9 5.8 5.1 5 9.4 8.3 5.7 7.8 6.5 7 9.3 6.6 10.8 13.1 12.1 9.9 12.4 11.3 11 12.1 7.1 13 13.7 12.9 7.5 8.7 10.5 10 8.1 10.6 10.5 13.4 14.1 13.5 13 12.3 13.7 9.1 13.1 13.2 8.6 9.8 9.9 11.8 13.5 14 10.8 12.3 14 Var risposta= valore nutritivo in Kj Var trattamento 1 = colonne – varietà diverse Var trattamento 2 = zone diverse Interazione = varietà diversa x zona diversa Unità sperimentali = singole misurazioni- frutti ripetute per varietà e zona H0 α : α1 = α 2= … α i = 0 gli effetti del trattamento A colonna sono uguali e nulli; HA α: non tutti gli α i = 0 ------------------------------------------------H0 β : β1= β 2…. βj = 0 gli effetti del trattamento B riga sono uguali e nulli; HA β: non tutti gli βj = 0 --------------------------------------------------H0 α β : α1 β1= α1 β 2… = α β ij = 0 gli effetti della interazione AB sono uguali e nulli; HA α β: non tutti gli α β ij = 0 Numero trattamenti A colonne = k=4; numero trattamenti B righe B = j =3 Numero ripetizioni per interazione trattamento A x trattamento B = n = 6 Gradi di libertà totali =(k*j*n)-1= (4*3*6) -1 = 72-1= 71 Gradi di libertà tra trattamenti A -colonne = k-1 = 4-1= 3 Gradi di libertà tra trattamenti B -righe = j-1 = 3-1 = 2 Gradi di libertà della interazione =( k-1) (j-1)= 3*2 =6 Gradi di libertà della variazione residua-errore =k*j*(n-1)= 4*3*(6-1)= 60 F critico per RV trattamento A colonne : alfa= 0.05, 3 gdl al numeratore / 60 gdl al denominatore = 2.76 F critico per RV trattamento B righe: alfa= 0.05, 2 gdl al numeratore / 60 gdl al denominatore =3.15 F critico per RV interazione fattori colonne-righe: alfa= 0.05, 6 gdl al numeratore / 60 gdl al denominatore = 2.25 ANALISI VARIANZA Analisi Dati Excel F 5.478780443 37.74306931 1.922834169 Origine della variazione SQ gdl MQ Campione-Righe-Zone Colonne-Varietà Interazione residuo 31.50694444 325.5748611 33.17305556 172.5216667 2 3 6 60 15.75347 108.525 5.528843 2.875361 Totale 562.7765278 71 Valore di significatività F crit 0.00652495 7.82751E-14 0.091675558 3.150411 2.758078 2.254055 Quindi rifiuto H0 α, rifiuto H0 β, non rifiuto H0 α β. Accetto le rispettive HA α e HA β e H0 α β. I risultati indicano che sia le varietà del frutto che le zone di coltivazione hanno un effetto significativo sulla valore nutritivo dello stesso, ma non l’interazione dei due fattori. Con il programma STATA -------------------------------------------------------------------------------anova varrisposta variet##zona Number of obs = 72 Root MSE = 1.69569 R-squared = Adj R-squared = 0.6934 0.6372 Source | Partial SS df MS F Prob > F ------------+---------------------------------------------------Model | 390.25487 11 35.4777155 12.34 0.0000 | variet | 325.574872 3 108.524957 37.74 0.0000 zona | 31.5069453 2 15.7534726 5.48 0.0065 variet#zona | 33.1730526 6 5.5288421 1.92 0.0917 | Residual | 172.521668 60 2.87536114 ------------+---------------------------------------------------Total | 562.776538 71 7.92643012 --------------------------------------------------------------------------------------- I risultati sono uguali Risoluzione esercizio con il software R (v2.15.1) #Importazione dati data_frutti<-read.csv2(file.choose(), header= TRUE, sep= ";", dec=",", na.strings=" ") #importa dataset "anova2_1R.csv" #Visualizzo un estratto del dataset head(data_frutti) > head(data_frutti) zona risposta varietà 1 6.9 1 1 11.8 1 1 6.2 1 1 9.2 1 1 9.2 1 1 6.2 1 #Uso il comando ‘colnames’ che permette di visualizzare il nome delle variabili colnames(data_frutti) > colnames(data_frutti) [1] "zona" "risposta" "varietà" #Utilizzo il comando ‘attach’ per gestire le variabili con il loro nome attach(data_frutti) #Comunico al software la natura nominale categorica delle variabili blocchi zona<-as.factor(zona) varietà<-as.factor(varietà) #Calcolo le statistiche di sintesi della variabile risposta, della variabile varietà e della variabile zona summary(risposta) > summary(risposta) Min. 1st Qu. Median 5.000 7.075 9.200 Mean 3rd Qu. 9.457 12.100 Max. 14.100 summary(varietà) > summary(varietà) 1 2 3 4 18 18 18 18 summary(zona) > summary(zona) 1 2 3 24 24 24 #Applico l’analisi della varianza (ANOVA) a 2 vie con interazione anova(lm(risposta~varietà+zona+varietà:zona)) > anova(lm(risposta~varietà+zona+varietà:zona)) Analysis of Variance Table Response: risposta Df Sum Sq Mean Sq F value Pr(>F) varietà 3 325.57 108.525 37.7431 7.828e-14 zona 2 31.51 15.753 5.4788 0.006525 varietà:zona 6 33.17 5.529 1.9228 0.091676 Residuals 60 172.52 2.875 --Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 *** ** . ‘.’ 0.1 ‘ ’ 1 Esercizio-esempio 2 La tavola seguente riporta dei punteggi sulla maturità emotiva di 27 giovani maschi classificati secondo l’età e secondo l’uso di marijuana. Valutare le differenze tra le medie per maturità emotiva secondo i fattori A( uso di marijuana), B (età) e l’interazione dei due A*B. Sia alfa = 0.05 per tutti i test. Fattore A ( uso di marijuana) Fattore B (Età) 15-19 20-24 25-29 Mai 25 28 22 28 32 30 25 35 30 Occasionalmente 18 23 19 16 24 20 14 16 15 Giornalmente 17 24 19 18 22 20 10 8 12 Var risposta= punteggio maturità emotiva Var trattamento A = colonne –uso di marijuana Var trattamento B = righe- età Interazione =uso marijuana x età Unità sperimentali = singoli soggetti repliche per uso marijuana ed età H0 α : α1 = α 2= … α i = 0 gli effetti del trattamento A colonna sono uguali e nulli; HA α: non tutti gli α i = 0 ------------------------------------------------H0 β : β1= β 2…. βj = 0 gli effetti del trattamento B riga sono uguali e nulli; HA β: non tutti gli βj = 0 --------------------------------------------------H0 α β : α1 β1= α1 β 2… = α β ij = 0 gli effetti della interazione AB sono uguali e nulli; HA α β: non tutti gli α β ij = 0 Numero trattamenti A colonne= k=3; numero trattamenti B righe = j =3 Numero ripetizioni per interazione trattamento A x trattamento B = n = 3 Gradi di libertà totali =(k*j*n)-1= (3*3*3) -1 = 27-1= 26 Gradi di libertà tra trattamenti A-colonne = k-1 = 3-1= 2 Gradi di libertà tra trattamenti B-righe = j-1 = 3-1 = 2 Gradi di libertà della interazione AB =( k-1) (j-1)= 2*2 =4 Gradi di libertà della variazione residua-errore =k*j*(n-1)= 3*3*(3-1)= 18 F critico per RV trattamento A: alfa= 0.05, 2 gdl al numeratore / 18 gdl al denominatore = 3.55 F critico per RV trattamento B: alfa= 0.05, 2 gdl al numeratore / 18 gdl al denominatore =3.55 F critico per RV interazione fattori AB colonne-righe: alfa= 0.05, 4 gdl al numeratore / 18 gdl denominatore = 2.93 Analisi varianza: a due fattori con replica RIEPILOGO 15-19 Conteggio Somma Media Varianza 3 75 25 9 3 60 20 7 3 9 60 195 20 21.66667 13 13.5 3 90 30 4 3 60 20 16 3 9 60 210 20 23.33333 4 31 3 90 30 25 3 45 15 1 3 9 30 165 10 18.33333 4 88.75 20-24 Conteggio Somma Media Varianza 25-29 Conteggio Somma Media Varianza Totale Conteggio Somma Media Varianza 9 9 9 255 165 150 28.33333 18.33333 16.66667 15.75 12.25 30.25 ANALISI VARIANZA Origine della variazione Campione-righe-età Colonne-uso marijuana Interazione Errore residuo SQ 116.6667 716.6667 183.3333 166 gdl 2 2 4 18 Totale 1182.667 26 MQ F Valore di significatività F crit 58.33333 6.325301 0.008308 3.554561 358.3333 38.85542 2.94E-07 3.554561 45.83333 4.96988 0.007071 2.927749 9.222222 Quindi rifiuto H0 α, rifiuto H0 β, rifiuto H0 α β. Accetto le rispettive HA. I risultati indicano che sia l’uso di marijuana sia l’età che l’interazione dei due fattori hanno un effetto significativo sulla maturità emotiva. In particolare in presenza di interazione significativa dei fattori, l’effetto dei singoli fattori viene subordinato a questa ultima, ovvero l’uso di marijuana per età. Degno di nota è il valore di F e relativa significatività per il trattamento A uso di marijuana che indicherebbe un effetto più forte per questo fattore. …… Se osserviamo le medie della tabella riportata notiamo che effettivamente chi non fa mai uso di marijuana nella età minore ha maturità emotiva più alta di chi fa uso giornaliero nella età maggiore…… ulteriori valutazioni si rendono opportune per queste interazioni…... Controlliamo anche con il programma STATA . anova varrisposta usomarijuana##et Number of obs = 27 Root MSE = 3.03681 R-squared = Adj R-squared = 0.8596 0.7973 Source | Partial SS df MS F Prob > F ---------------+---------------------------------------------------Model | 1016.66667 8 127.083333 13.78 0.0000 | usomariju~a | 716.666667 2 358.333333 38.86 0.0000 6.33 0.0083 et | 116.666667 2 58.3333333 usomariju~a#et | 183.333333 4 45.8333333 4.97 0.0071 | Residual | 166 18 9.22222222 ---------------+---------------------------------------------------Total | 1182.66667 26 45.4871795 Il risultato è uguale Esercizio-esempio 3 Un esperimento in soggetti adolescenti è stato programmato per studiare gli effetti di tre farmaci diversi in tre tipi di condizioni da stress, che procuravano ansia. La tavola riporta le differenze tra i punteggi, pre – e post- trattamento dei 18 soggetti che hanno partecipato all’esperimento. Valutare se esistono differenze per livelli diversi dei due fattori e la loro interazione. Condizioni da stress (Fattore B) Farmaco (Fattore A) A B C I 4 5 1 3 1 0 II 6 6 6 6 6 3 III 5 4 7 4 4 5 Var risposta= effetto dei farmaci espresso in punteggio Var trattamento A = colonne –tipo di farmaco Var trattamento B = condizioni da stress Interazione =tipo farmaco x condizioni da stress Unità sperimentali = singoli adolescenti repliche per farmaco e condizioni da stress H0 α : α1 = α 2= … α i = 0 gli effetti del trattamento A colonna sono uguali e nulli; HA α: non tutti gli α i = 0 ------------------------------------------------H0 β : β1= β 2…. βj = 0 gli effetti del trattamento B riga sono uguali e nulli; HA β: non tutti gli βj = 0 --------------------------------------------------H0 α β : α1 β1= α1 β 2… = α β ij = 0 gli effetti della interazione AB sono uguali e nulli; HA α β: non tutti gli α β ij = 0 Numero trattamenti A colonne= k=3; numero trattamenti B righe = j =3 Numero ripetizioni per interazione trattamento A x trattamento B = n = 2 Gradi di libertà totali =(k*j*n)-1= (3*3*2) -1 = 18-1= 17 Gradi di libertà tra trattamenti A -colonne = k-1 = 3-1= 2 Gradi di libertà tra trattamenti B -righe = j-1 = 3-1 = 2 Gradi di libertà della interazione AB =( k-1) (j-1)= 2*2 =4 Gradi di libertà della variazione residua-errore =k*j*(n-1)= 3*3*(2-1)= 9 F critico per RV trattamento A: alfa= 0.05, 2 gdl al numeratore / 9 gdl al denominatore = 4.26 F critico per RV trattamento B: alfa= 0.05, 2 gdl al numeratore / 9 gdl al denominatore =4.26 F critico per RV interazione fattori colonne-righe: alfa= 0.05, 4 gdl al numeratore / 9 gdl al denominatore = 3.63 Analisi varianza: a due fattori con replica RIEPILOGO A B C Totale 2 9 4.5 0.5 2 4 2 2 2 1 0.5 0.5 6 14 2.333333 3.866667 2 12 6 0 2 12 6 0 2 9 4.5 4.5 6 33 5.5 1.5 2 2 9 11 4.5 5.5 0.5 4.5 2 9 4.5 0.5 6 29 4.833333 1.366667 6 6 30 27 5 4.5 0.8 5.1 6 19 3.166667 5.366667 Stress I Conteggio Somma Media Varianza Stress II Conteggio Somma Media Varianza Stress III Conteggio Somma Media Varianza Totale Conteggio Somma Media Varianza ANALISI VARIANZA SQ Origine della variazione Campione-righe-stress 33.44444 Colonne-farmaco 10.77778 Interazione 9.888889 Residuo 13 Totale 67.11111 gdl 2 2 4 9 MQ F Valore di significatività F crit 16.72222 11.57692 0.003247 4.256492 5.388889 3.730769 0.066065 4.256492 2.472222 1.711538 0.230886 3.63309 1.444444 17 Quindi rifiuto H0 α, rifiuto H0 β, non rifiuto H0 α β. Accetto le rispettive HA α e HA β e H0 α β. I risultati indicano che sia il tipo di farmaco che le condizioni da stress danno risultati significativamente sugli effetti del farmaco, ma non l’interazione dei due fattori. Lo stress inoltre appare avere un effetto più forte rispetto al tipo di farmaco sulla variabile risposta. Controlliamo anche con il programma STATA anova varrisposta stress##farmaco Number of obs = 18 Root MSE = 1.20185 R-squared = Adj R-squared = 0.8063 0.6341 Source | Partial SS df MS F Prob > F ---------------+---------------------------------------------------Model | 54.1111111 8 6.76388889 4.68 0.0166 | stress | 33.4444444 2 16.7222222 11.58 0.0032 farmaco | 10.7777778 2 5.38888889 3.73 0.0661 stress#farmaco | 9.88888889 4 2.47222222 1.71 0.2309 | Residual | 13 9 1.44444444 ---------------+---------------------------------------------------Total | 67.1111111 17 3.94771242 Il risultato è uguale Esercizio-esempio 4 La seguente tavola riporta le misure sulla capacità vitale di 60 maschi adulti classificati secondo l’età ed il tipo di lavoro. Valutare le differenze tra i tipi di lavoro, le classi d’età e l’interazione delle due, alfa = 0.05 Tipo di lavoro classe età 1 2 3 A 4.31 4.89 4.05 4.44 4.59 4.13 4.61 3.91 4.52 4.43 3.79 4.17 4.47 4.35 3.59 B 4.68 6.18 4.48 4.23 5.92 3.41 3.64 3.32 3.51 3.75 4.63 4.59 4.9 5.31 4.81 C 4.17 3.77 5.2 5.28 4.44 3.89 3.64 4.18 4.48 4.27 5.81 5.2 5.34 5.94 5.56 D 5.75 5.7 5.53 5.97 5.52 4.58 5.21 5.5 5.18 4.15 6.89 6.18 6.21 7.56 6.73 Var risposta= capacità vitale Var trattamento 1 = colonne – tipo di lavoro Var trattamento 2 = righe -classi d’età Interazione = tipo lavoro x classi età Unità sperimentali = soggetti diversi repliche misurati per le combinazioni di lavoro e classe età H0 α : α1 = α 2= … α i = 0 gli effetti del trattamento A colonna sono uguali e nulli; HA α: non tutti gli α i = 0 ------------------------------------------------H0 β : β1= β 2…. βj = 0 gli effetti del trattamento B riga sono uguali e nulli; HA β: non tutti gli βj = 0 --------------------------------------------------H0 α β : α1 β1= α1 β 2… = α β ij = 0 gli effetti della interazione AB sono uguali e nulli; HA α β: non tutti gli α β ij = 0 Numero trattamenti A colonne = k=4; numero trattamenti-blocchi righe B = j =3 Numero ripetizioni per interazione trattamento A x trattamento B = n = 5 Gradi di libertà totali =(k*j*n)-1= (4*3*5) -1 = 60-1= 59 Gradi di libertà tra trattamenti A -colonne = k-1 = 4-1= 3 Gradi di libertà tra trattamenti B – righe = j-1 = 3-1 = 2 Gradi di libertà della interazione AB=( k-1) (j-1)= 3*2 =6 Gradi di libertà della variazione residua-errore =k*j*(n-1)= 4*3*(5-1)= 48 F critico per RV trattamento A: alfa= 0.05, 3 gdl al numeratore / 48 gdl al denominatore = 2.80 F critico per RV trattamento B: alfa= 0.05, 2 gdl al numeratore / 48 gdl al denominatore =3.20 F critico per RV interazione AB fattori colonne-righe: alfa= 0.05, 6 gdl al numeratore / 48gdl al denominatore = 2.30 ANALISI VARIANZA Origine della variazione SQ Campione 12.30879 Colonne 19.77855 Interazione 8.948863 In 10.05424 Totale 51.09044 gdl 2 3 6 48 MQ F Valore di significatività F crit 6.154395 29.38173 4.65E-09 3.190721 6.592849 31.47495 2.13E-11 2.79806 1.491477 7.120469 1.83E-05 2.294598 0.209463 59 Quindi rifiuto H0 α, rifiuto H0 β, rifiuto H0 α β. Accetto le rispettive HA. I risultati indicano che sia il tipo di lavoro che l’età che l’interazione dei due fattori hanno un effetto significativo sulla capacità vitale . In particolare in presenza di interazione significativa dei fattori, l’effetto dei singoli fattori viene subordinato a questa ultima, ovvero il tipo di attività lavorativa per la classe d’età. Verifica con STATA anova varrrisposta et##tipolavoro Number of obs = 60 Root MSE = .457672 R-squared = Adj R-squared = 0.8032 0.7581 Source | Partial SS df MS F Prob > F --------------+---------------------------------------------------Model | 41.036198 11 3.73056346 17.81 0.0000 | 29.38 0.0000 et | 12.3087893 2 6.15439464 tipolavoro | 19.7785454 3 6.59284846 31.47 0.0000 et#tipolavoro | 8.94886338 6 1.49147723 7.12 0.0000 | Residual | 10.0542389 48 .209463311 --------------+---------------------------------------------------Total | 51.0904369 59 .865939609 Il risultato è uguale