Università degli Studi del Piemonte Orientale
Corso di Laurea in Infermieristica
Corso integrato in Scienze della Prevenzione e dei Servizi sanitari
Statistica
Lezione 7
a.a 2011-2012
Dott.ssa Daniela Ferrante
[email protected]
La verifica di ipotesi sulla differenza fra due medie
“Si considerino due popolazioni di individui sottoposti a due
diversi trattamenti farmacologici. Si vuole valutare ad esempio
se tali trattamenti producono uguali effetti (ipotesi nulla) o
diversi (ipotesi alternativa)”
Estraggo un campione da ognuna delle due popolazioni ed
effettuo le misurazione della variabile in studio sui due campioni
calcolando quindi le medie delle due serie.
Se le due medie sono diverse, si vuole valutare se tale
differenza sia dovuta al caso e quindi i due trattamenti hanno lo
stesso effetto oppure se effettivamente si osserva un effetto
diverso tra i due trattamenti
2
Campioni indipendenti
H0 : µ1 = µ2 oppure µ1 - µ2 = 0
H1 per un test ad una coda : H1 : µ1 >µ2 oppure µ1 < µ2
H1 per un test a due code : H1 : µ1 ≠ µ2 oppure µ1 - µ2 ≠ 0
3
Consideriamo il seguente caso relativamente a due
campioni indipendenti:
- Campionamento effettuato da popolazioni distribuite
normalmente con varianza delle popolazioni non nota e
omogeneità della varianza ossia
t=
( x1 − x 2 ) − ( µ1 − µ 2 ) 0
 sp2 sp2 


+
 n1

n
2


σ 12 = σ 22
sp2
Gdl della t = (n1-1)+(n2-1)
( n1 − 1) s12 + ( n 2 − 1) s 2 2
=
n1 + n2 − 2
4
Esempio
Si intende misurare l’efficacia di un farmaco per il
trattamento della depressione. Sono confrontati due gruppi:
un gruppo al quale è stato somministrato il farmaco (n=33) e
il gruppo placebo (n=43). La media della Hamilton
Depression Scale è pari a 20.38 nel primo gruppo (s=3.91)
e pari a 21.57 nel secondo (s=3.87).
Stabilire se la differenza tra le due medie è statisticamente
significativa a livello alfa=0,01
5
H0 : µ1 = µ2
H1 : µ1 ≠ µ2
t=
( x1 − x 2 ) − ( µ1 − µ 2 ) 0
 sp
sp 


+
 n1

n
2


2
sp
2
2
=
( 20 .38 − 21 .57 ) − 0
 15,11 15,11 
+


33
43


= −1.32
( 32 ) 3 . 91 2 + ( 42 ) 3 . 87 2
=
= 15 . 11
33 + 43 − 2
gl = 74
-1.32 >-2,85 quindi non rifiuto H0
6
Consideriamo i seguenti due casi relativamente a due
campioni appaiati:
• Vengono confrontati i valori presi sugli stessi soggetti in due
momenti diversi oppure allo stesso soggetto vengono
somministrati due trattamenti differenti
• Il confronto tra trattamento e controllo viene effettuato per
cercare di controllare possibili fonti di variabilità che
potrebbero oscurare la vera differenza tra le due serie di
misurazioni
• I soggetti di un determinato gruppo sono appaiati con i
soggetti di un altro gruppo in modo tale da rendere i due
gruppi simili per alcune caratteristiche quali ad esempio età,
sesso, etc.
7
Esempio
• Ad 8 individui adulti è stata misurata la pressione arteriosa
prima e dopo l’assunzione di un farmaco
A
B
C
D
E
F
G
H
200 191 9
174 170 4
198 177 21
170 167 3
179 159 20
182 151 31
193 176 17
209 183 26
C’è sufficiente evidenza statistica a supporto dell’ipotesi che
ci sia una differenza?
8
La formulazione del problema fa capire che si tratta di un
test a due code, con
d − d0
16 , 37 − 0
t =
=
= 4 , 55
H0 : dmedio = 0
s
10 , 20
n
8
H1 : dmedio ≠ 0
d=
131
= 16,37
8
s = 10,20
Valore critico per 7 gdl ; test a due code; p<α
quindi la probabilità che la differenza tra media osservata e
media attesa sia casuale è <0,05
Si rifiuta H0.
9
Funzione excel
TEST.T - Restituisce la probabilità associata a un test t di
Student.
10
TEST.T(matrice1;matrice2;coda;tipo)
Matrice1 è il primo insieme di dati.
Matrice2 è il secondo insieme di dati.
Coda specifica il numero di code di distribuzione.
Se coda = 1, TEST.T utilizzerà la distribuzione a una coda.
Se coda = 2, TEST.T utilizzerà la distribuzione a due code.
Tipo è il tipo di test t da eseguire
Se tipo è uguale
1 Accoppiato
2 Omoschedastico (varianza uguale di due campioni)
3 Eteroschedastico (varianza disuguale di due campioni)
11