Università degli Studi del Piemonte Orientale Corso di Laurea in Infermieristica Corso integrato in Scienze della Prevenzione e dei Servizi sanitari Statistica Lezione 7 a.a 2011-2012 Dott.ssa Daniela Ferrante [email protected] La verifica di ipotesi sulla differenza fra due medie “Si considerino due popolazioni di individui sottoposti a due diversi trattamenti farmacologici. Si vuole valutare ad esempio se tali trattamenti producono uguali effetti (ipotesi nulla) o diversi (ipotesi alternativa)” Estraggo un campione da ognuna delle due popolazioni ed effettuo le misurazione della variabile in studio sui due campioni calcolando quindi le medie delle due serie. Se le due medie sono diverse, si vuole valutare se tale differenza sia dovuta al caso e quindi i due trattamenti hanno lo stesso effetto oppure se effettivamente si osserva un effetto diverso tra i due trattamenti 2 Campioni indipendenti H0 : µ1 = µ2 oppure µ1 - µ2 = 0 H1 per un test ad una coda : H1 : µ1 >µ2 oppure µ1 < µ2 H1 per un test a due code : H1 : µ1 ≠ µ2 oppure µ1 - µ2 ≠ 0 3 Consideriamo il seguente caso relativamente a due campioni indipendenti: - Campionamento effettuato da popolazioni distribuite normalmente con varianza delle popolazioni non nota e omogeneità della varianza ossia t= ( x1 − x 2 ) − ( µ1 − µ 2 ) 0 sp2 sp2 + n1 n 2 σ 12 = σ 22 sp2 Gdl della t = (n1-1)+(n2-1) ( n1 − 1) s12 + ( n 2 − 1) s 2 2 = n1 + n2 − 2 4 Esempio Si intende misurare l’efficacia di un farmaco per il trattamento della depressione. Sono confrontati due gruppi: un gruppo al quale è stato somministrato il farmaco (n=33) e il gruppo placebo (n=43). La media della Hamilton Depression Scale è pari a 20.38 nel primo gruppo (s=3.91) e pari a 21.57 nel secondo (s=3.87). Stabilire se la differenza tra le due medie è statisticamente significativa a livello alfa=0,01 5 H0 : µ1 = µ2 H1 : µ1 ≠ µ2 t= ( x1 − x 2 ) − ( µ1 − µ 2 ) 0 sp sp + n1 n 2 2 sp 2 2 = ( 20 .38 − 21 .57 ) − 0 15,11 15,11 + 33 43 = −1.32 ( 32 ) 3 . 91 2 + ( 42 ) 3 . 87 2 = = 15 . 11 33 + 43 − 2 gl = 74 -1.32 >-2,85 quindi non rifiuto H0 6 Consideriamo i seguenti due casi relativamente a due campioni appaiati: • Vengono confrontati i valori presi sugli stessi soggetti in due momenti diversi oppure allo stesso soggetto vengono somministrati due trattamenti differenti • Il confronto tra trattamento e controllo viene effettuato per cercare di controllare possibili fonti di variabilità che potrebbero oscurare la vera differenza tra le due serie di misurazioni • I soggetti di un determinato gruppo sono appaiati con i soggetti di un altro gruppo in modo tale da rendere i due gruppi simili per alcune caratteristiche quali ad esempio età, sesso, etc. 7 Esempio • Ad 8 individui adulti è stata misurata la pressione arteriosa prima e dopo l’assunzione di un farmaco A B C D E F G H 200 191 9 174 170 4 198 177 21 170 167 3 179 159 20 182 151 31 193 176 17 209 183 26 C’è sufficiente evidenza statistica a supporto dell’ipotesi che ci sia una differenza? 8 La formulazione del problema fa capire che si tratta di un test a due code, con d − d0 16 , 37 − 0 t = = = 4 , 55 H0 : dmedio = 0 s 10 , 20 n 8 H1 : dmedio ≠ 0 d= 131 = 16,37 8 s = 10,20 Valore critico per 7 gdl ; test a due code; p<α quindi la probabilità che la differenza tra media osservata e media attesa sia casuale è <0,05 Si rifiuta H0. 9 Funzione excel TEST.T - Restituisce la probabilità associata a un test t di Student. 10 TEST.T(matrice1;matrice2;coda;tipo) Matrice1 è il primo insieme di dati. Matrice2 è il secondo insieme di dati. Coda specifica il numero di code di distribuzione. Se coda = 1, TEST.T utilizzerà la distribuzione a una coda. Se coda = 2, TEST.T utilizzerà la distribuzione a due code. Tipo è il tipo di test t da eseguire Se tipo è uguale 1 Accoppiato 2 Omoschedastico (varianza uguale di due campioni) 3 Eteroschedastico (varianza disuguale di due campioni) 11