Diapositiva 1 - e

INTRODUZIONE
ALL’ANALISI DELLA
VARIANZA
ANALISI DELLA VARIANZA (ANOVA)
E’ UNA TECNICA STATISTICA NATA NELL’AMBITO
DELLA RICERCA SPERIMENTALE PER VALUTARE
L’EFFETTO DI DETERMINATI FATTORI, VARIABILI
INDIPENDENTI -DI TIPO CONTINUO O
CATEGORIALE , SULLA VARIABILE DIPENDENTE DI TIPO CONTINUO-.
ES. SE CONFRONTIAMO L’EFFETTO DI UN
NUOVO FARMACO NELLA CURA DELLA
DEPRESSIONE VERSO L’EFFETTO DI UN
FARMACO STANDARD (CONFRONTO DI 2
GRUPPI), USIAMO IL TEST T DI STUDENT;
IMPLEMENTIAMO UN’ANOVA QUANDO IL
CONFRONTO E’ FATTO SU + DI 2 GRUPPI.
SE PERO’ SI VUOLE TENER CONTO ANCHE
DEL FATTO CHE I PAZIENTI PROVENGONO DA
2 O + CLINICHE DIVERSE E CHE QUINDI
L’AZIONE COMBINATA DEL TIPO DI
OSPEDALE E TIPO DI FARMACO PUO’
CONGIUNTAMENTE INFLUENZARE L’ESITO
DELLA CURA, ALLORA RICORRIAMO
ALL’ANALISI DELLA VARIANZA A + FATTORI.
L’ANALISI DELLA VARIANZA ASSUME NOMI DIVERSI
A SECONDA DI QUANTE SONO LE VARIABILI
DIPENDENTI E INDIPENDENTI.
ANOVA AD UNA VIA (ONE-WAY) QUANDO SI HA UNA
SOLA VARIABILE DIPENDENTE E UNA SOLA
VARIABILE INDIPENDENTE.
ANOVA FATTORIALE QUANDO SI HA UNA SOLA
VARIABILE DIPENDENTE, MA PIU’ VARIABILI
INDIPENDENTI.
MANOVA (MULTIVARIATE ANALYSIS OF VARIANCE)
QUANDO C’E’ + DI UNA DIPENDENTE E + DI UNA
INDIPENDENTE.
Qual è la logica dell’ANOVA?
O meglio quali ipotesi sono sottoposte a verifica e quale
ragionamento porta all’accettazione o al rifiuto di esse?
Nell’ANOVA le ipotesi sono:
H0 : 1= 2=... p
H1: almeno due delle medie sono tra loro differenti
Facciamo inferenza sulle medie, ma lavoriamo sulla scomposizione
della varianza.
ANOVA con un fattore di classificazione


y
e
Modello di analisi
ij
i
ij
i=1,…,I
j=1,…,J
n=I*J
yij: osservazione sulla j-esima unità dell’i-esimo gruppo di
trattamento
: media generale
i: -i effetto dell’i-esimo livello di trattamento;
eij: errore i.i.d. N(0,2)
Scomposizione della variabilità totale
Analisi della varianza = la variabilità totale viene scomposta
in variabilità attribuibile alle differenze tra i c gruppi e
variabilità dovuta al caso e inerente alle variazioni all’interno
dei gruppi.
Variabilità all’interno dei gruppi (SSW)  errore sperimentale
Variabilità tra i gruppi (SSA)  effetti del trattamento
Si ha che:
SST = SSA + SSW
Il rapporto tra varianza between e varianza within è il test F di Fisher.
F=VARB/VARW
Questo test ha una distribuzione campionaria F di Snedecor, per un
valore  prefissato, solitamente =0.05, questo test ci dice quando
l’ipotesi nulla è accettata (<0.05) e quando viene rifiutata (>0.05).
Il test F è la principale diagnostica dell’ANOVA, ci dice se almeno
due medie sono statisticamente diverse.
Se vogliamo sapere quali delle medie sono diverse usiamo delle
correzioni per i confronti multipli, ovvero facciamo dei test t tra
le coppie delle medie. Vengono applicate delle correzioni sul livello
di significatività per il fatto che sono fatti + confronti sugli stessi dati.
Test F per la ANOVA a un fattore
Il valore critico Fu viene determinato in funzione del
livello di significatività  del test.
Se H0 è vera ci aspettiamo che il valore osservato di F sia vicino a 1.
Se H0 è falsa ci aspettiamo che F assuma valori significativamente superiori a
1  la variabilità totale è dovuta soprattutto all’effetto del trattamento
Test F per la ANOVA a un
fattore
I risultati del test F per la ANOVA a un fattore
vengono sintetizzati in una tabella come quella
seguente:
Confronti multipli
Il rifiuto dell'ipotesi nulla non costituisce molto spesso un
risultato sufficiente. Infatti non esiste una ipotesi alternativa
unica, ma una volta rifiutata quella nulla, possono essere
prese in considerazione numerose ipotesi alternative anche
complesse cioè costituite da combinazioni di medie.
Se l'H0 è: M1 = M2 =... = Mi, alcune delle ipotesi alternative
possono essere:
M1 > M2 ; M1 > M3 ; M2 > M3 ; e in generale Mn > Mp
Se H0 è stata rifiutata, lo sperimentatore è interessato a
proseguire l'analisi per individuare i motivi che hanno
provocato il rifiuto, cioè ad individuare quale delle possibili
differenze tra le medie dei trattamenti o tra combinazioni di
esse risulti significativamente diversa da zero.
• D.M.S.
• Una possibilità, facilmente applicabile, consiste nel saggiare
la significatività delle differenze tra le medie mediante un
normale test di t di Student. Il procedimento può essere
strutturato calcolando dapprima le differenze tra le medie dei
trattamenti e verificandone la significatività mediante
confronto con un valore minimo significativo pari a:
2
2
S
D
.M
.S
.
t*
n
• dove:
• S2 = varianza dell’errore
• n=
numero di ripetizioni (numero di osservazioni che
formano le medie confrontate)
• t = valore di t per il livello di probabilità voluto (0.05 o 0.01)
corrispondente ai gradi di libertà dell’errore
• se i criteri di classificazione sono due, è possibile
visualizzare schematicamente la struttura
dell'esperimento ed i relativi dati sperimentali ottenuti in
una tabella a due entrate, una per criterio: ogni
intersezione delle righe e delle colonne della tabella
definisce una casella o cella alla quale idealmente
vengono assegnate una o più unità sperimentali
sottoposte ad un trattamento che corrisponde ai due
livelli dei fattori di variabilità che individuano la casella
stessa.
Fattore 1
Fattore 2
a
b
c
m
am
bm
cm
n
an
bn
cn
• Analisi fattoriale della varianza
• In termini tecnici piani sperimentali in cui è
possibile valutare congiuntamente l'effetto di
due o più fonti di variabilità vengono definiti
esperimenti fattoriali. Tipicamente in essi uno
dei risultati rilevanti è costituito dalla verifica
dell'additività del modello mediante stima
dell'interazione.
ANOVA FATTORIALE: disegni con 2 o più fattori
viene valutato l’effetto di due o più variabili indipendenti
Due o più
fattori
ANOVA
FATTORIALE
EFFETTI
PRINCIPALI
EFFETTI DI
INTERAZIONE