La verifica delle ipotesi Ipotesi nulla Il processo di verifica di ipotesi è un processo di falsificazione dell’ipotesi nulla (contenente lo stato dell’arte) contro l’ipotesi alternativa (contenente il nuovo) Essa rappresenta l’opposto di ciò che speriamo di dimostrare tramite l’esperimento Per esempio : volendo dimostrare che un nuovo farmaco induce un miglioramento rispetto al farmaco tradizionale, si formulano le seguenti ipotesi H 0 : s c H 0 : s c oppure H : 1 s c H : 1 s c L’ipotesi alternativa può essere unidirezionale L’ipotesi statistica è un’affermazione sul parametro incognito della popolazione Ipotesi nulla H 0 : 80 H1 : 80 Ipotesi semplice Ipotesi composta bidirezionale Ipotesi alternativa Nei trials clinici, l’ipotesi alternativa bidirezionale è più prudente di quella unidirezionale. Il test bidirezionale è più cautelativo del test unidirezionale e ciò implica che occorre un campione più numeroso per avere lo stesso grado di certezza di poter dimostrare la differenza tra i trattamenti quando questa esiste Ragionamento inferenziale Parte dall’assunzione iniziale che l’ipotesi nulla sia vera, ovvero non vi sia differenza tra trattamento e placebo Si pone questa domanda fondamentale:”Se l’ipotesi nulla è vera, quanto è probabile ottenere per effetto del caso una differenza tra i due trattamenti uguale o superiore a quella osservata nei campioni dello studio?” Procedimento: 1. Individuare la statistica test 2. Fissare un valore di probabilità sufficientemente basso (livello di significatività del test α) 3. Determinare il valore campionario della statistica test 4. Confrontarlo con il valore critico della statistica test ottenuto in corrispondenza del livello di significatività. Per esempio: su un campione di 50 soggetti glicemici trattati con il farmaco oggetto di studio si stima un livello medio di glicemia di 99.1 e una deviazione standard campionaria S=1.3. E’ possibile rigettare l’ipotesi nulla seguente ad un livello di significatività del 5%? H 0 : 100 H1 : 100 Procedimento: la statistica test è t student con 49 g.l. Per un livello di significatività del test del 5% e un test unidirezionale il valore critico è t0.05(49)~z0. 05=-1.64 il valore campionario della statistica test è -4.90 t 99.1 100 4.90 1.3 1 / 50 -1.64 Il valore campionario ha una probabilità di verificarsi per effetto del caso inferiore al 5%. Perciò possiamo rifiutare l’ipotesi nulla Il p-value del valore campionario è p<0.00001 e il risultato è altamente significativo Test su due medie R z : z z 2 H 0 : 1 2 H1 : 1 2 H 0 : 1 2 R z : z z H1 : 1 2 Varianze note z X 1 X 2 1 2 2 1 n1 2 2 n2 ~. N 0,1 Test su due medie H 0 : 1 2 H1 : 1 2 H 0 : 1 2 R t : t t 2 R t : t t H1 : 1 2 Varianze incognite ma uguali t X 1 X 2 1 2 1 1 S p2 n1 n2 ~. t n1 n2 2 Esercizio Un'unità di cardiologia ha in uso due macchine diverse. Ci si chiede se i tempi di esecuzione siano differenti per le due macchine. A questo scopo vengono osservati i tempi di esecuzione di 10 interventi, ottenendo, per la prima macchina, un tempo medio M1=55 con una deviazione standard s1=1.4, per la seconda, un tempo medio M2=53 con una deviazione standard S2=1.5 1. Ad un livello di significatività del 5% verificare l’ipotesi nulla che il tempo medio di esecuzione sia uguale per le due macchine, contro un’ipotesi alternativa bidirezionale 2. Si vuole costruire un intervallo di confidenza al 95% per 1-2 3. In base all’intervallo ottenuto si può accettare l’ipotesi nulla che non vi sia differenza tra le due macchine? Svolgimento n M s g.l. I gruppo II gruppo 10 55 1.4 9 10 53 1.5 9 Test su due medie H 0 : 1 2 H1 : 1 2 H 0 : 1 2 R z : z z 2 R z : z z H1 : 1 2 Varianze incognite ma diverse: campioni grandi z x1 x2 1 2 S12 S 22 n1 n2 Test su due medie H 0 : 1 2 H1 : 1 2 H 0 : 1 2 R t : t t 2 R t : t t H1 : 1 2 Varianze incognite ma diverse: campioni piccoli t' x1 x2 1 2 2 1 2 2 S S n1 n2 t ( Behrens Fisher ) Test su due varianze H0 : 2 1 R F : F F 2 2 2 H1 : 12 22 H 0 : 12 22 H1 : 2 1 R F : F F 2 2 S12 Sotto H0 di uguaglianza delle due F 2 ~. Fn 1,n 1 1 2 S2 varianze: In un test bidirezionale, seguiamo la convenzione di inserire al numeratore del rapporto la varianza campionaria maggiore per ottenere il valore critico di F per α/2 con gli appropriati gradi di libertà Test su due medie campioni appaiati pazien Prima del ti trattamento Dopo il trattamento 1 x1 Y1 d1 2 x2 Y2 d2 3 x3 Y3 d3 4 x4 Y4 d4 H 0 : 1 2 H1 : 1 2 t d sd n ~. tn 1 di H0 : 0 H1 : 0 R t : t t 2 Test su una frequenza H 0 : p p0 R z : z z 2 H1 : p p0 H 0 : p p0 H1 : p0 p0 z R z : z z f p0 ~. N 0,1 p0 1 p0 n Test su due frequenze R z : z z 2 H 0 : p1 p2 H1 : p1 p2 H 0 : p1 p2 R z : z z H1 : p1 p2 z f1 f 2 p1 p2 1 1 f 1 f n1 n2 ~. N 0,1 dove n1 f1 n2 f 2 f n1 n2 Non rifiuto H0 Rifiuto H0 H0 vera H0 falsa 1-α α β 1- β Nella fase di pianificazione dell’esperimento in genere si sceglie α =0.05 o α=0.01 e β=0.20 L’errore α è ritenuto più grave dell’errore β! Errore di I specie È l’errore che si commette rifiutando l’ipotesi nulla quando è vera È un risultato Falso positivo La probabilità di commettere un tale errore è data dal livello di significatività statistica α Errore di II specie È l’errore che si commette accettando l’ipotesi nulla quando è falsa È un risultato Falso negativo La probabilità di commettere un tale errore è indicata con β. La probabilità di prendere una decisione corretta rifiutando l’ipotesi nulla quando è falsa è 1- β e si chiama potenza del test Anche nel sistema giudiziario, l’imputato è considerato innocente fino a prova contraria Cosa determina la potenza del test? La probabilità dell’erroreHdi I specie 0 μ0 μ1 β α H1 Se aumenta α, si riduce β e aumenta la potenza del test β’ α Glantz, 2003 Cosa determina la potenza del test? la dimensione dell’effetto La dimensione dell’effetto che si vuole rilevare, relativamente alla 2. variabilità della popolazione: 1. La statistica test utilizzata per il confronto tra due medie è: s 2 1 x1 x2 Per semplicità assumiamo n1=n2. Allora il t calcolato sui dati è una stima di t' Se indichiamo con 1 2 1 2 2 n 2 n allora t' 1 2 2n 2 n La potenza del test aumenta all’aumentare del parametro di non centralità n1 s22 n2 H0 H1 μ0 μ1 β α Se aumenta la distanza tra le due ipotesi in termini di deviazione standard, si riduce β e aumenta la potenza del test H0 H’1 μ0 α è invariato. β’< β β’ μ1 α μ’1 Funzione di potenza Nella maggior parte dei casi non è possibile controllare né alpha né l’entità dell’effetto del trattamento misurato in termini di deviazione standard della popolazione Si può intervenire aumentando la dimensione del campione Cosa determina la potenza del test? La dimensione campionaria La potenza cresce all’aumentare della dimensione campionaria per due motivi: 1. 2. Quando la numerosità campionaria aumenta, anche il numero dei gradi di libertà aumenta e il valore che, sotto l’ipotesi di inefficacia, definisce il valore estremo dei possibili valori del test statistico corrispondente all’errore α diventa più piccolo Come mostra la formula di t’, il valore di t aumenta al crescere della dimensione campionaria. Ne consegue che la distribuzione campionaria di t quando l’effetto del trattamento ipotizzato è elevato, è centrata su valori sempre più grandi al crescere della numerosità campionaria Esercizio 1: Calcolare la potenza del test su una media dati n, α e l’ipotesi alternativa H1 H0 H1 H 0 : 26 H1 : 26 H1 : 30 100 n 100 n 10 0.05 26 30 Esercizio: Calcolare la potenza del test su una media, dati n, α e l’ipotesi alternativa H1 H0 H1 H 0 : 26 H1 : 30 100 n 100 n 10 0.05 26 30 0.05 Prz 1.96 H 0 Prx 26 1.96 *10 45.6 Prx 45.6 H1 Pr z 1 1 0.9406 0.06 45.6 30 1.56 0.9406 10 45.6 Se invece l’ipotesi alternativa H1 è unidirezionale H0 H1 H 0 : 26 H1 : 26 100 n 100 n 10 0.05 26 30 0.05 Prz 1.64 H 0 Prx 26 1.64 *10 42.2 Prx 42.2 H1 Pr z 1 1 0.8925 0.11 42.2 30 1.24 0.8925 10 42.2 Esercizio 2: Calcolare la potenza del test sulla differenza tra due medie dati n1,n2, α e l’ipotesi alternativa H1 H0 H1 H 0 : 1 2 100 H1 : 1 2 100 H1 : 1 2 150 1 2 100 n1 100 n2 150 ˆ p 100 1 1 100 150 0.05 100 150 0.05 Prz 1.96 H 0 Prx1 x2 100 1.96 *12.91 125.31 Prx1 x2 125.31 H1 Pr z 1 1 0.028 0.972 125.31 125.31 150 1.92 0.028 12.91 Esercizio 3: Calcolare la potenza del test sulla differenza tra due proporzioni dati n1,n2, α e l’ipotesi alternativa H1 H0 H1 H 0 : p1 0.10 H1 : p2 0.14 n1 67 n2 61 pˆ 0.10 * 67 0.14 * 61 0.12 67 61 0.05 1 1 s0 0.12 * 0.88 * 0.0575 67 61 s1 0.10 * 0.90 0.14 * 0.86 0.0576 67 61 0 0.05 Prz 1.96 H 0 Pr f1 f 2 0 1.96 * 0.0575 0.1127 0.04 0.1127 0.04 Prf1 f 2 0.1127 H1 Pr z 1.262 0.896 0.0576 1 1 0.896 0.10 0.1127 Esercizio4: Stima della dimensione campionaria n in funzione della potenza del test, α e l’ipotesi alternativa H Test sulla media 1. H H1 0 H 0 : 26 H1 : 30 100 0.05 0.20 26 30 100 0.05 Prz 1.96 H 0 Pr x 26 1.96 * n 100 0.20 Prz 0.84 H1 Pr x 30 0.84 * n 26 1.96 * 100 100 30 0.84 * n n 1.96 0.84100 n 30 26 2 z z n 2 1 2 2 Esercizio 5: Stima della dimensione campionaria in funzione della potenza del test, di α e data l’ipotesi alternativa H1. Test sulla frequenza H0 H1 H 0 : p1 0.10 H1 : p2 0.14 n1 67 n2 61 0.05 0.20 0 z n 2 p0 1 p0 z p1 p2 p1 1 p1 2 0.04