INTRODUZIONE ALL’ANALISI DELLA VARIANZA ANALISI DELLA VARIANZA (ANOVA) E’ UNA TECNICA STATISTICA NATA NELL’AMBITO DELLA RICERCA SPERIMENTALE PER VALUTARE L’EFFETTO DI DETERMINATI FATTORI, VARIABILI INDIPENDENTI -DI TIPO CONTINUO O CATEGORIALE , SULLA VARIABILE DIPENDENTE DI TIPO CONTINUO-. ES. SE CONFRONTIAMO L’EFFETTO DI UN NUOVO FARMACO NELLA CURA DELLA DEPRESSIONE VERSO L’EFFETTO DI UN FARMACO STANDARD (CONFRONTO DI 2 GRUPPI), USIAMO IL TEST T DI STUDENT; IMPLEMENTIAMO UN’ANOVA QUANDO IL CONFRONTO E’ FATTO SU + DI 2 GRUPPI. SE PERO’ SI VUOLE TENER CONTO ANCHE DEL FATTO CHE I PAZIENTI PROVENGONO DA 2 O + CLINICHE DIVERSE E CHE QUINDI L’AZIONE COMBINATA DEL TIPO DI OSPEDALE E TIPO DI FARMACO PUO’ CONGIUNTAMENTE INFLUENZARE L’ESITO DELLA CURA, ALLORA RICORRIAMO ALL’ANALISI DELLA VARIANZA A + FATTORI. L’ANALISI DELLA VARIANZA ASSUME NOMI DIVERSI A SECONDA DI QUANTE SONO LE VARIABILI DIPENDENTI E INDIPENDENTI. ANOVA AD UNA VIA (ONE-WAY) QUANDO SI HA UNA SOLA VARIABILE DIPENDENTE E UNA SOLA VARIABILE INDIPENDENTE. ANOVA FATTORIALE QUANDO SI HA UNA SOLA VARIABILE DIPENDENTE, MA PIU’ VARIABILI INDIPENDENTI. MANOVA (MULTIVARIATE ANALYSIS OF VARIANCE) QUANDO C’E’ + DI UNA DIPENDENTE E + DI UNA INDIPENDENTE. Qual è la logica dell’ANOVA? O meglio quali ipotesi sono sottoposte a verifica e quale ragionamento porta all’accettazione o al rifiuto di esse? Nell’ANOVA le ipotesi sono: H0 : 1= 2=... p H1: almeno due delle medie sono tra loro differenti Facciamo inferenza sulle medie, ma lavoriamo sulla scomposizione della varianza. ANOVA con un fattore di classificazione y e Modello di analisi ij i ij i=1,…,I j=1,…,J n=I*J yij: osservazione sulla j-esima unità dell’i-esimo gruppo di trattamento : media generale i: -i effetto dell’i-esimo livello di trattamento; eij: errore i.i.d. N(0,2) Scomposizione della variabilità totale Analisi della varianza = la variabilità totale viene scomposta in variabilità attribuibile alle differenze tra i c gruppi e variabilità dovuta al caso e inerente alle variazioni all’interno dei gruppi. Variabilità all’interno dei gruppi (SSW) errore sperimentale Variabilità tra i gruppi (SSA) effetti del trattamento Si ha che: SST = SSA + SSW Il rapporto tra varianza between e varianza within è il test F di Fisher. F=VARB/VARW Questo test ha una distribuzione campionaria F di Snedecor, per un valore prefissato, solitamente =0.05, questo test ci dice quando l’ipotesi nulla è accettata (<0.05) e quando viene rifiutata (>0.05). Il test F è la principale diagnostica dell’ANOVA, ci dice se almeno due medie sono statisticamente diverse. Se vogliamo sapere quali delle medie sono diverse usiamo delle correzioni per i confronti multipli, ovvero facciamo dei test t tra le coppie delle medie. Vengono applicate delle correzioni sul livello di significatività per il fatto che sono fatti + confronti sugli stessi dati. Test F per la ANOVA a un fattore Il valore critico Fu viene determinato in funzione del livello di significatività del test. Se H0 è vera ci aspettiamo che il valore osservato di F sia vicino a 1. Se H0 è falsa ci aspettiamo che F assuma valori significativamente superiori a 1 la variabilità totale è dovuta soprattutto all’effetto del trattamento Test F per la ANOVA a un fattore I risultati del test F per la ANOVA a un fattore vengono sintetizzati in una tabella come quella seguente: Confronti multipli Il rifiuto dell'ipotesi nulla non costituisce molto spesso un risultato sufficiente. Infatti non esiste una ipotesi alternativa unica, ma una volta rifiutata quella nulla, possono essere prese in considerazione numerose ipotesi alternative anche complesse cioè costituite da combinazioni di medie. Se l'H0 è: M1 = M2 =... = Mi, alcune delle ipotesi alternative possono essere: M1 > M2 ; M1 > M3 ; M2 > M3 ; e in generale Mn > Mp Se H0 è stata rifiutata, lo sperimentatore è interessato a proseguire l'analisi per individuare i motivi che hanno provocato il rifiuto, cioè ad individuare quale delle possibili differenze tra le medie dei trattamenti o tra combinazioni di esse risulti significativamente diversa da zero. • D.M.S. • Una possibilità, facilmente applicabile, consiste nel saggiare la significatività delle differenze tra le medie mediante un normale test di t di Student. Il procedimento può essere strutturato calcolando dapprima le differenze tra le medie dei trattamenti e verificandone la significatività mediante confronto con un valore minimo significativo pari a: 2 2 S D .M .S . t* n • dove: • S2 = varianza dell’errore • n= numero di ripetizioni (numero di osservazioni che formano le medie confrontate) • t = valore di t per il livello di probabilità voluto (0.05 o 0.01) corrispondente ai gradi di libertà dell’errore • se i criteri di classificazione sono due, è possibile visualizzare schematicamente la struttura dell'esperimento ed i relativi dati sperimentali ottenuti in una tabella a due entrate, una per criterio: ogni intersezione delle righe e delle colonne della tabella definisce una casella o cella alla quale idealmente vengono assegnate una o più unità sperimentali sottoposte ad un trattamento che corrisponde ai due livelli dei fattori di variabilità che individuano la casella stessa. Fattore 1 Fattore 2 a b c m am bm cm n an bn cn • Analisi fattoriale della varianza • In termini tecnici piani sperimentali in cui è possibile valutare congiuntamente l'effetto di due o più fonti di variabilità vengono definiti esperimenti fattoriali. Tipicamente in essi uno dei risultati rilevanti è costituito dalla verifica dell'additività del modello mediante stima dell'interazione. ANOVA FATTORIALE: disegni con 2 o più fattori viene valutato l’effetto di due o più variabili indipendenti Due o più fattori ANOVA FATTORIALE EFFETTI PRINCIPALI EFFETTI DI INTERAZIONE