La verifica delle ipotesi

annuncio pubblicitario

La verifica delle ipotesi
Ipotesi nulla
Il processo di verifica di ipotesi è un processo di
falsificazione dell’ipotesi nulla (contenente lo
stato dell’arte)
contro l’ipotesi alternativa (contenente il nuovo)

Essa rappresenta l’opposto di ciò che speriamo di
dimostrare tramite l’esperimento
Per esempio : volendo dimostrare che un nuovo farmaco induce un
miglioramento rispetto al farmaco tradizionale, si formulano le seguenti
ipotesi
H 0 :  s  c
H 0 :  s  c
oppure H :   
1
s
c
H :  
1
s
c
L’ipotesi alternativa può essere unidirezionale
L’ipotesi statistica è un’affermazione sul parametro
incognito della popolazione
Ipotesi nulla
H 0 :   80
H1 :   80
Ipotesi semplice
Ipotesi composta bidirezionale
Ipotesi alternativa
Nei trials clinici, l’ipotesi alternativa bidirezionale è più prudente di quella
unidirezionale.
Il test bidirezionale è più cautelativo del test unidirezionale e ciò implica
che occorre un campione più numeroso per avere lo stesso grado di
certezza di poter dimostrare la differenza tra i trattamenti quando questa
esiste
Ragionamento inferenziale


Parte dall’assunzione iniziale che l’ipotesi nulla sia vera,
ovvero non vi sia differenza tra trattamento e placebo
Si pone questa domanda fondamentale:”Se l’ipotesi nulla è
vera, quanto è probabile ottenere per effetto del caso una
differenza tra i due trattamenti uguale o superiore a quella
osservata nei campioni dello studio?”
Procedimento:
1. Individuare la statistica test
2. Fissare un valore di probabilità sufficientemente basso (livello di
significatività del test α)
3. Determinare il valore campionario della statistica test
4. Confrontarlo con il valore critico della statistica test ottenuto in
corrispondenza del livello di significatività.
Per esempio: su un campione di 50 soggetti glicemici trattati con il farmaco
oggetto di studio si stima un livello medio di glicemia di 99.1 e una deviazione
standard campionaria S=1.3. E’ possibile rigettare l’ipotesi nulla seguente ad
un livello di significatività del 5%?
H 0 :   100
H1 :   100
Procedimento:
la statistica test è t student con 49 g.l.
Per un livello di significatività del test del 5% e un test unidirezionale il
valore critico è t0.05(49)~z0. 05=-1.64
il valore campionario della statistica test è
-4.90
t
99.1  100
 4.90
1.3 1 / 50
-1.64
Il valore campionario ha una probabilità di verificarsi per effetto del caso inferiore
al 5%. Perciò possiamo rifiutare l’ipotesi nulla
Il p-value del valore campionario è p<0.00001 e il risultato è altamente significativo
Test su due medie
R  z : z  z 2 
H 0 : 1   2
H1 : 1   2
H 0 : 1   2
R  z : z  z 
H1 : 1   2
Varianze note
z
X 1  X 2  1   2 

2
1
n1


2
2
n2
~. N 0,1
Test su due medie
H 0 : 1   2
H1 : 1   2
H 0 : 1   2
R  t : t  t 2 
R  t : t  t 
H1 : 1   2
Varianze incognite ma uguali
t
X 1  X 2  1   2 
1 1
S p2   
 n1 n2 
~. t n1  n2  2
Esercizio
Un'unità di cardiologia ha in uso due macchine diverse. Ci si chiede se i tempi di esecuzione siano
differenti per le due macchine. A questo scopo vengono osservati i tempi di esecuzione di 10
interventi, ottenendo, per la prima macchina, un tempo medio M1=55 con una deviazione standard
s1=1.4, per la seconda, un tempo medio M2=53 con una deviazione standard S2=1.5
1. Ad un livello di significatività del 5% verificare l’ipotesi nulla che il tempo medio di esecuzione
sia uguale per le due macchine, contro un’ipotesi alternativa bidirezionale
2. Si vuole costruire un intervallo di confidenza al 95% per 1-2
3. In base all’intervallo ottenuto si può accettare l’ipotesi nulla che non vi sia differenza tra le due
macchine?
Svolgimento
n
M
s
g.l.
I gruppo II gruppo
10
55
1.4
9
10
53
1.5
9
Test su due medie
H 0 : 1   2
H1 : 1   2
H 0 : 1   2
R  z : z  z 2 
R  z : z  z 
H1 : 1   2
Varianze incognite ma diverse:
campioni grandi
z
x1  x2  1   2 
S12 S 22

n1 n2
Test su due medie
H 0 : 1   2
H1 : 1   2
H 0 : 1   2
R  t : t  t 2 
R  t : t  t 
H1 : 1   2
Varianze incognite ma diverse:
campioni piccoli
t' 
x1  x2  1   2 
2
1
2
2
S
S

n1 n2
 t 
( Behrens  Fisher )
Test su due varianze
H0 :  
2
1
R  F : F  F 2 
2
2
H1 :  12   22
H 0 :  12   22
H1 :   
2
1
R  F : F  F 
2
2
S12
Sotto H0 di uguaglianza delle due F  2 ~. Fn 1,n 1
1
2
S2
varianze:
In un test bidirezionale, seguiamo la convenzione di inserire al numeratore
del rapporto la varianza campionaria maggiore per ottenere il valore critico
di F per α/2 con gli appropriati gradi di libertà
Test su due medie
campioni appaiati
pazien Prima del
ti
trattamento
Dopo il
trattamento
1
x1
Y1
d1
2
x2
Y2
d2
3
x3
Y3
d3
4
x4
Y4
d4
H 0 : 1   2
H1 : 1   2
t
d
sd
n
~. tn 1
di
H0 :  0
H1 :   0
R  t : t  t 2 
Test su una frequenza
H 0 : p  p0
R  z : z  z 2 
H1 : p  p0
H 0 : p  p0
H1 : p0  p0
z
R  z : z  z 
f  p0
~. N 0,1
p0 1  p0 
n
Test su due frequenze
R  z : z  z 2 
H 0 : p1  p2
H1 : p1  p2
H 0 : p1  p2
R  z : z  z 
H1 : p1  p2
z
f1  f 2   p1  p2 
1 1 
f 1  f   
 n1 n2 
~. N 0,1
dove
n1 f1  n2 f 2
f 
n1  n2
Non rifiuto H0
Rifiuto H0
H0 vera
H0 falsa
1-α
α
β
1- β
Nella fase di pianificazione dell’esperimento in genere si sceglie α
=0.05 o α=0.01 e β=0.20
L’errore α è ritenuto più grave dell’errore β!
Errore di I specie
È l’errore che si commette rifiutando
l’ipotesi nulla quando è vera
 È un risultato Falso positivo
 La probabilità di commettere un tale
errore è data dal livello di significatività
statistica α

Errore di II specie
È l’errore che si commette accettando
l’ipotesi nulla quando è falsa
 È un risultato Falso negativo
 La probabilità di commettere un tale
errore è indicata con β.
 La probabilità di prendere una decisione
corretta rifiutando l’ipotesi nulla quando è
falsa è 1- β e si chiama potenza del test

Anche nel sistema giudiziario, l’imputato è considerato
innocente fino a prova contraria
Cosa determina la potenza del test?
La probabilità dell’erroreHdi I specie
0
μ0
μ1
β
α
H1
Se aumenta α, si riduce β e aumenta la potenza del test
β’
α
Glantz, 2003
Cosa determina la potenza del test?
la dimensione dell’effetto
La dimensione dell’effetto che si vuole rilevare, relativamente alla
2.
variabilità della popolazione:
1.
La statistica test utilizzata per il confronto tra due medie è:
s
2
1
x1  x2
Per semplicità assumiamo n1=n2. Allora il t calcolato sui dati è una stima di
t' 
Se indichiamo con

  1  2
1  2
2
 
n  2 n


allora
t' 
1  2
 2n


2
n
La potenza del test aumenta all’aumentare del parametro di non centralità



 
n1  s22 n2

H0
H1
μ0
μ1
β
α
Se aumenta la distanza tra le due ipotesi in termini di deviazione
standard, si riduce β e aumenta la potenza del test
H0
H’1
μ0
α è invariato. β’< β
β’
μ1
α
μ’1
Funzione di potenza

Nella maggior parte dei casi non è
possibile controllare né alpha né l’entità
dell’effetto del trattamento misurato in
termini di deviazione standard della
popolazione
Si può intervenire aumentando la dimensione
del campione
Cosa determina la potenza del test?
La dimensione campionaria
La potenza cresce all’aumentare della dimensione
campionaria per due motivi:
1.
2.
Quando la numerosità campionaria aumenta, anche il
numero dei gradi di libertà aumenta e il valore che, sotto
l’ipotesi di inefficacia, definisce il valore estremo dei
possibili valori del test statistico corrispondente all’errore
α diventa più piccolo
Come mostra la formula di t’, il valore di t aumenta al
crescere della dimensione campionaria. Ne consegue che
la distribuzione campionaria di t quando l’effetto del
trattamento ipotizzato è elevato, è centrata su valori
sempre più grandi al crescere della numerosità
campionaria
Esercizio 1: Calcolare la potenza del test su una
media dati n, α e l’ipotesi alternativa H1
H0
H1
H 0 :   26
H1 :   26  H1 :   30
  100
n  100  
n  10
  0.05
26
30
Esercizio: Calcolare la potenza del test su una
media, dati n, α e l’ipotesi alternativa H1
H0
H1
H 0 :   26
H1 :   30
  100
n  100  
n  10
  0.05
26
30
0.05  Prz  1.96 H 0   Prx  26  1.96 *10  45.6


  Prx  45.6 H1  Pr z 
1    1  0.9406  0.06
45.6  30  1.56  0.9406
10


45.6
Se invece l’ipotesi alternativa H1 è unidirezionale
H0
H1
H 0 :   26
H1 :   26
  100
n  100  
n  10
  0.05
26
30
0.05  Prz  1.64 H 0   Prx  26  1.64 *10  42.2


  Prx  42.2 H1  Pr z 
1    1  0.8925  0.11
42.2  30  1.24  0.8925
10


42.2
Esercizio 2: Calcolare la potenza del test sulla differenza
tra due medie dati n1,n2, α e l’ipotesi alternativa H1
H0
H1
H 0 : 1   2  100
H1 : 1   2  100  H1 : 1   2  150
 1   2  100
n1  100
n2  150  ˆ p  100
1
1

100 150
  0.05
100
150
0.05  Prz  1.96 H 0   Prx1  x2  100  1.96 *12.91  125.31


  Prx1  x2  125.31 H1  Pr z 
1    1  0.028  0.972
125.31
125.31  150  1.92  0.028
12.91


Esercizio 3: Calcolare la potenza del test sulla differenza
tra due proporzioni dati n1,n2, α e l’ipotesi alternativa H1
H0
H1
H 0 : p1  0.10
H1 : p2  0.14
n1  67
n2  61  pˆ 
0.10 * 67  0.14 * 61
 0.12
67  61
  0.05
1
 1
s0  0.12 * 0.88 *     0.0575
 67 61 
s1 
0.10 * 0.90 0.14 * 0.86

 0.0576
67
61
0
0.05  Prz  1.96 H 0   Pr f1  f 2  0  1.96 * 0.0575  0.1127
0.04

0.1127  0.04


  Prf1  f 2  0.1127 H1  Pr z 
 1.262  0.896
0.0576


1    1  0.896  0.10
0.1127
Esercizio4: Stima della dimensione campionaria n in funzione
della potenza del test, α e l’ipotesi alternativa H
Test
sulla
media
1.
H
H1
0
H 0 :   26
H1 :   30
  100
  0.05
  0.20
26
30
100 

0.05  Prz  1.96 H 0   Pr x  26  1.96 *

n


100 

0.20  Prz  0.84 H1  Pr x  30  0.84 *

n

26  1.96 *
100
100
 30  0.84 *
n
n
 1.96  0.84100 
n

 30  26 
2

 

  z   z   
 
n   2
 1   2  




2
Esercizio 5: Stima della dimensione campionaria in
funzione della potenza del test, di α e data l’ipotesi
alternativa H1. Test sulla frequenza
H0
H1
H 0 : p1  0.10
H1 : p2  0.14
n1  67
n2  61
  0.05
  0.20
0

  z
n   2



p0 1  p0   z 
 p1  p2 

p1 1  p1   




2
0.04