Potenza di un test e Intervalli di confidenza 1 Indice Definizione di potenza di un test e dei parametri da cui dipende Potenza e ampiezza campionaria Analisi della varianza Confronto di due proporzioni RR e OR Tabelle di contingenza Definizione di IC ed applicazione nella verifica delle ipotesi IC per: Media di una popolazione Tassi e proporzioni RR e OR Intera popolazione 2 Riepilogo sull’uso dei test Ipotesi per la applicazione di un test: H0 vera quando i dati hanno BASSA probabilità verificarsi, RIFIUTIAMO H0 e concludiamo che di c’è differenza STATISTICAMENTE SIGNIFICATIVA tra i trattamenti 3 Riepilogo sull’uso dei test Analogamente quando i dati hanno ALTA probabilità di verificarsi, ACCETTIAMO H0 e concludiamo che NON c’è differenza STATISTICAMENTE SIGNIFICATIVA tra i trattamenti porta a discutere i risultati come se il trattamento non ha effetto PROBLEMA: Non è stato dimostrata l’EFFICACIA del trattamento dimensione dell’effetto variabilità della popolazione numerosità dei campioni 4 Esempio: diuretico efficace PROBLEMA: Dimostrare l’efficacia di un nuovo diuretico FASE SPERIMENTALE: 1) G=20 us Gc =10 us → placebo Gt =10 us → farmaco 2) Misura di diuresi dopo 24h H0: Non c’è differenza tra Gc e Gt ATTENZIONE!!!!!! Ipotesi nel t-test: H0 vera (il trattamento NON è efficace) Ipotesi ora: H0 falsa (il trattamento E’ efficace) 5 Esempio: diuretico efficace RISULTATO: Media ± DS Gc Gt 600 800 1000 1200 1400 1600 1800 2000 diuresi (ml/giorno) Gc: MEDIA=1180ml/giorno, DS=144ml/giorno Gt: MEDIA=1400ml/giorno, DS=245ml/giorno eseguo il t-test 6 Esempio: diuretico efficace T-test (H0 falsa): 1 1 2 2 s = sGc + sGt = (1442 + 2452 ) = 2012 2 2 2 t= (s ( ) XGt − XGc 2 / nGt ) + (s / nGc ) 2 = 1400 − 1180 (201 2 / 10 ) + (201 / 10 ) 2 = 2.447 Fisso α=5% ed essendo ν=2(n-1)=18 ⇒tc,18=2.101 t > tc ovvero, il farmaco ha AUMENTATO la diuresi VERO!!!! 7 Esempio: diuretico efficace Sotto ipotesi H0 falsa, cambio il campione RISULTATO: Media ± DS Gc Gt 600 800 1000 1200 1400 1600 1800 2000 diuresi (ml/giorno) Gc: MEDIA=1216ml/giorno, DS=97ml/giorno Gt: MEDIA=1368ml/giorno, DS=263ml/giorno eseguo il t-test 8 Esempio: diuretico efficace T-test: 1 1 2 2 s = sGc + sGt = (2632 + 97 2 ) = 1982 2 2 2 t= (s ( ) XGt − XGc 2 / nGt ) + (s / nGc ) 2 = 1368 − 1216 (198 2 / 10 ) + (198 / 10 ) 2 = 1.71 Fisso α=5% ed essendo ν=2(n-1)=18 ⇒ tc,18=2.101 t < tc ovvero, il farmaco NON ha AUMENTATO la diuresi 9 FALSO!!!! Osservazione Nell’applicazione di un test PROBLEMA: evitare di rifiutare l’ipotesi di inefficacia, quando essa in realtà è vera, cioè controllare la probabilità di ottenere dei FALSI POSITIVI Ora si vuole non rifiutare l’ipotesi di inefficacia, quando essa in realtà è falsa, cioè controllare la probabilità di ottenere dei FALSI NEGATIVI Qual è la probabilità di compiere questo secondo tipo di errore? 10 Risposta intuitiva Sotto l’ipotesi che il farmaco è EFFICACE, ripetiamo l’esperimento 200 volte (si riportano i valori del t-test) H0 vera α=5% H0 falsa 111 valori di t sono > tc =2.101 Con α=5%, c’è una probabilità pari a 111/200=55% di concludere che il diuretico aumenta la produzione di urina quando questa in media aumenta di 200ml/giorno La POTENZA del test è 0.55 e quantifica la 11 PROBABILITA’ di rilevare una differenza reale Tipi di conclusione nel test di ipotesi CONCLUSIONI tratte dalle OSSERVAZIONI SITUAZIONE REALE TRATTAMENTO è EFFICACE TRATTAMENTO è INEFFICACE Trattamento è efficace Vero Positivo Conclusione corretta (1-β) Falso positivo Errore di tipo I (α) Trattamento è inefficace Falso negativo Errore di tip II (β) Vero negativo Conclusione corretta (1- α) La POTENZA di un test è (1-β) ovvero Es: Un test con potenza 0.55, significa che c’è una probabilità del 55% di evidenziare come statisticamente significativo un effetto che esiste realmente 12 Potenza di un test Gli errori di I e II tipo sono interdipendenti: prove più stringenti per dichiarare che un farmaco ha effetto (RIDURRE α) determina aumento della probabilità di NON rilevare l’effetto vero (AUMENTO β) ovvero si RIDUCE la POTENZA Per rendere PICCOLI sia α che β si deve: AUMENTARE LA NUMEROSITA’ CAMPIONARIA, poiché con più osservazioni si può avere maggiore fiducia nelle conclusioni 13 Potenza di un test I fattori da cui dipende la POTENZA di un test sono: la dimensione dell’errore di I tipo α la dimensione della differenza che si vuole rilevare, relativamente alla variabilità della popolazione la numerosità del campione 14 Dimensione dell’errore α Il VALORE CRITICO è determinato dalla distribuzione del test statistico sotto ipotesi: H0 VERA La POTENZA è la proporzione dei valori possibili del test che cadono oltre questa soglia sotto ipotesi: H0 FALSA ATTENZIONE!!! La Gaussiana cambia perché il trattamento modifica il valor medio La POTENZA è 0.55 o equivalentemente β (la probabilità di incorrere in un errore di II tipo e accettare l’ipotesi di inefficacia quando esiste un effetto) è 15 1-0.55=0.45=45% Dimensione dell’errore α Esigiamo prove più convincenti per concludere che il diuretico è efficace. La Potenza scende a 0.45! Per avere prove più convincenti, abbiamo ridotto la probabilità di concludere erroneamente circa l’efficacia (α), ma abbiamo accresciuto il rischio di non riuscire a rilevare l’effetto quando esiste (β) perché abbiamo ridotto la 16 potenza. Dimensione della differenza Se l’effetto da evidenziare cambia, cambiano anche la Gaussiana e la POTENZA. E’ più facile rilevare differenze grandi che piccole. 17 Funzione di potenza Ripetendo l’operazione per tutti i possibili valori dell’effetto del trattamento: FUNZIONE di POTENZA Es: Se il farmaco aumenta la produzione di urina di 200ml/giorno, c’è una probabilità del 55% di rilevarlo Misura quanto più facilmente si rileva una modificazione di urina, al crescere dell’effetto del farmaco 18 Variabilità della popolazione La variabilità della popolazione influenza la probabilità di riuscire ad evidenziare l’effetto di un trattamento. Formula del t-test: t= X1 − X2 X1 − X2 δ n = = = 2 2 2/n σ 2 (s / n1 ) + (s / n2 ) σ 2 / n n1=n2 s (variabilità della popolazione) diminuisce ↑ ↓ potenza del test nel rilevare un effetto aumenta δ/σ Posto δ = X1 − X2 Parametro di NON CENTRALITA’, Φ si quantifica 19 Numerosità del campione La POTENZA aumenta all’aumentare della numerosità del campione perché: aumenta il numero di GL e il valore critico diminuisce il valore di t calcolato aumenta al crescere di n δ n t= σ 2 20 us ⇒ν=2(20-1)=38 GL 20 Funzione di potenza Ripetendo l’operazione con diverse numerosità campionarie, fissato l’incremento medio: FUNZIONE di POTENZA All’aumentare della numerosità cresce la potenza Il calcolo della POTENZA viene utilizzato per stimare la DIMENSIONE CAMPIONARIA necessaria per rilevare un effetto. 21 Funzione di potenza Curve di POTENZA del t-test per il confronto di due gruppi sperimentali con numerosità n e α=0.05 ES: Calcolare la POTENZA del t-test con un rischio di errore del I tipo α =0.05, utilizzato per rilevare una modificazione media di urina di 200ml/giorno in una popolazione con deviazione standard di 200ml/giorno δ 200 Φ= = = 1 n=10 σ 200 Potenza=0.55 22 Esempio: alotano/morfina Dati: si CAMPIONI n G1:us con ALOTANO 9 2.08(l/m2) 1.05(l/m2) G2:us con MORFINA 16 1.75(l/m2) 0.88(l/m2) Xi T-test: alotano e morfina non producono risultati significativamente differenti dell’indice cardiaco, vista la differenza del 15% fra gli indici cardiaci associati con questi due anestetici (2.08-2.08*x=1.75 ⇒x=15%) Tesi: Qual è la potenza di questo esperimento se si vuole rilevare una differenza del 25% che può essere clinicamente significativa? 23 Esempio: alotano/morfina Risoluzione: Una differenza del 25% dell’indice corrisponde a 0.52l/m2 (=25% di 2.08 l/m2). cardiaco δ Calcoliamo il parametro di NON CENTRALITA’: Φ = σ 2 2 ( 9 − 1)(1 .05 ) + (16 − 1)( 0 .88 ) s = = 0 .89 (l / m 2 ) 2 9 + 16 − 2 2 0 .52 Φ = = 0 .553 0 .89 I due gruppi hanno numerosità diverse ⇒ si sceglie il gruppo più piccolo ⇒ la potenza è 0.16 Conclusione: E’ molto improbabile che questa sperimentazione rilevi una modificazione del 25% 24 Riepilogo La potenza di un test indica che l’ipotesi di inefficacia del trattamento sia rifiutata, se il trattamento ha effetto Tanto più stringenti sono le prove che esigiamo per affermare l’efficacia di un trattamento, tanto più bassa è la potenza del test Quanto più grande è la numerosità del campione, tanto maggiore è la potenza del test La procedura specifica per determinare la potenza di un test dipende dal test stesso 25 Calcolo della potenza e ampiezza campionaria per ANOVA OSSERVAZIONE: Questi calcoli si differenziano solo per: 1. il MODO in cui viene dell’effetto del trattamento 2. la RELAZIONE grandezza quantificata MATEMATICA tra l’entità questa 3. il rischio di concludere erroneamente che c’è un effetto del trattamento. 26 Potenza per ANOVA δ n 1. Si calcola Φ = σ 2k numero di gruppi di trattamento se i k-gruppi hanno medie µi diverse Φ = con µ = ∑µ i i n ∑ ( µ i − µ) 2 i s2k k 2. Si determina νn=k-1 e νd=k(n-1) 3. Si consulta il diagramma di potenza opportuno 27 Ampiezza campionaria per ANOVA ATTENZIONE!!! L’ampiezza campionaria compare in Φ e in vd Per trovare l’ampiezza campionaria n bisogna fare vari tentativi: → si fissa n e si calcola la potenza → si corregge fino a quando la potenza calcolata è vicina al valore desiderato 28 Esempio: ciclo mestruale e corsa PROBLEMA: Capire se le donne che corrono da dilettanti o da professioniste hanno andamenti mestruali differenti dalle donne che conducono vita sedentaria. Si vuole rilevare una differenza di δ=1 ciclo mestruale/anno con σ=2 cicli/anno, k=3 (Gdil, Gprof, Gcon), n=26 e α=5% 1 Φ= 2 Risoluzione: 26 = 1 .04 νn=3-1=2 e νd=3(26-1)=75 2 ⋅3 Potenza=0.32 29 Esempio: ciclo mestruale e corsa PROBLEMA: Si vuole aumentare la potenza a 0.80. Quanti campioni devo scegliere? Risoluzione: Sappiamo che con 26 ho potenza 0.32. Guardo la curva Per potenza di 0.80 devo avere Φ≅2 ⇒ n è sotto radice nella definizione di Φ ⇒ aumento n di un fattore 4 30 Esempio: ciclo mestruale e corsa 1 100 Φ= = 2 .04 2 2 ⋅3 νn=3-1=2 e νd=3(100-1)=297 Potenza=0. 90 Per avere la potenza desiderata, scegliamo n=75: 1 Φ= 2 75 = 1 .77 2 ⋅3 Potenza=0.80 ν n=3-1=2 e νd=3(75-1)=222 Conclusione: Per avere una probabilità dell’80% di rilevare un cambiamento di 1 ciclo/anno fra i 3 gruppi di donne quando la deviazione standard è circa 2cicli/anno con un livello di 31 confidenza del 95%, occorrono 75 us. Potenza per confronto di due proporzioni OBIETIVO: Trovare la potenza del test z per valutare la differenza tra due proporzioni p1ep2 di numerosità n1 e n2 Test z: p1 − p2 z= sp1 −p2 che si distribuisce come una distribuzione normale con media p1 − p2 e deviazione standard sp1 −p2 = p1 (1 − p1 ) p2 (1 − p2 ) + n1 n2 32 Potenza per confronto di due proporzioni Distribuzione di tutti i differenze osservate p̂1 e p̂2 possibili valori delle Potenza: (1-β)*100% della distribuzione deve essere oltre la soglia H0 VERA (p1-p2)+zβ(1)sp1-p2 Percentile inferiore della normale standardizzata Si ottiene una potenza del (1-β)*100% ipotesi con significatività α*100% se (p1-p2)+zβ(1)sp1-p2=zαs0 per il rifiuto di 33 Potenza per confronto di due proporzioni La potenza del test è data dalla seguente probabilità: zα s0 − (p1 − p2 ) zβ(1) = sp1 −p2 Esempio: alotano/morfina Tesi: Dati CAMPIONI n MORTI Alotano 61 8 13.1 Morfina 67 10 14.9 % totale morti= % Qual è la potenza se si vuole evidenziare una differenza del 30% con una confidenza del 95%? 8 + 10 = 0.141 = 14% 61 + 67 Si vuole evidenziare differenza del 30% 34 Esempio: alotano/morfina Differenza del 30%= (8 + 16) − (8 + 16) * 30 / 100 = 0.098 = 10% 61 + 67 Quindi p1=0.14 (è la proporzione che quantifica il totale dei morti) e p2=0.10 (è la proporzione che quantifica la differenza del 30%); n1=61 e n2=67 0.14(1 − 0.14) 0.10(1 − 0.10) sp1 −p2 = + = 0.0576 61 67 p n + p2n2 Essendo p̂ = 1 1 = 0.119 calcolo s0: n1 + n2 s0 = p̂(1 − p̂ ) p̂(1 − p̂ ) + = n1 n2 0.119(1 − 0.119) 0.119(1 − 0.119) + = 0.0573 61 67 35 Esempio: alotano/morfina Fissato α=0.05 ⇒zc=1.96 ⇒ POTENZA è data dalla frazione di distribuzione superiore a : zβ(1) = 1.96 ⋅ 0.0573 − (0.14 − 0.10) = 1.255 0.0576 POTENZA=11% Conclusione: La potenza è bassa quindi la differenza tra i due anestetici non è significativa. 36 Potenza e numerosità campionaria per RR e OR Le formule precedenti sono utilizzate per stimare POTENZA e NUMEROSITA’ CAMPIONARIA per RR e OR. Non si specificano entrambe le proporzioni ma solo una (p1) e l’altra si ricava: RR = pesposti/(1 − pesposti) pesposti pnon esposti = p2 p1 p2 /(1 − p2 ) OR = = pnon esposti/(1 − pnon esposti) p1 /(1 − p1 ) ⇒ p2 = RR ⋅ p1 ⇒ OR ⋅ p1 p2 = 1 + p1 (OR − 1) 37 Finalità e limiti delle tecniche statistiche FINALITA’: Decidere se un insieme di osservazioni è compatibile con una certa ipotesi (probabilità e potenza del test) LIMITI: non quantificano l’entità dell’effetto non mettono in evidenza risultati che possono non essere statisticamente significativi OBIETTIVO: stimare l’entità dell’effetto del trattamento Intervalli di Confidenza (IC) 38 IC per differenza di due medie T-test: differenza delle medie campionarie t= errore standard della differenza delle medie eseguo il test. Campioni estratti da stessa popolazione la distribuzione dei valori di t ha MEDIA=0 SIMMETRICA rispetto ad origine Campioni estratti da popolazioni diverse la distribuzione dei valori di t ha MEDIA≠0 che dipende dall’entità dell’effetto del trattamento 39 IC per differenza di due medie Per avere MEDIA=0 a prescindere dall’efficacia del trattamento: diff. medie camp. - diff.vera medie popolazioni t= errore standard della differenza delle medie camp. (X1 - X2 ) - (µ1 - µ2 ) = sX −X 1 2 incognita Se H0 VERA (campioni estratti da stessa popolazione) µ1=µ2 ⇔ def precedente di t Scelto un appropriato valore di t, tα, stimiamo incognita usando l’equazione precedente. COME? 40 IC per differenza di due medie Per DEF: il 100α% di tutti i possibili valori di t comprende valori MINORI di -tα e MAGGIORI di +tα 1- α α -tα +tα Il 100(1- α)% di tutti i possibili valori di t è in ] -tα,+tα [ ES: il 95% dei possibili valori di t è in ] –t0.05,+t0.05 [ (X1 - X2 ) - (µ1 - µ2 ) − tα < < +tα sX −X 1 2 41 IC per differenza di due medie DEF: Intervallo di Confidenza per la differenza delle medie al 100(1- α)% è: (X1 - X2 ) − tα sX −X < µ1 - µ2 < (X1 - X2 ) + tα sX −X 1 2 1 2 la differenza vera delle medie delle popolazioni dalle quali provengono i campioni cade ad una distanza dalla differenza osservata delle medie campionarie inferiore a tα volte la deviazione standard delle medie campionarie Gradi di Distribuzione dipende da Libertà n. di campioni estratti numerosità di ciascun campione(GL) distribuzione della popolazione dalla quale i campioni sono estratti ATTENZIONE! tα ha ν=n1+n2-2 GL i campioni devono essere estratti da popolazioni che seguono una distribuzione normale 42 Esempio: diuretico efficace CASO IDEALE: TUTTA la popolazione di 200 individui è accessibile. Si misura la produzione media di urina. Tutti sono trattati con placebo ⇒ µpla=1200ml/giorno Tutti sono trattati con farmaco ⇒ µfar=1400ml/giorno µ pla- µ far=200ml/giorno CASO REALE: Sono accessibili solo 10 campioni! Dati: si CAMPIONI n Gpla 10 1150(ml/giorno) 144(ml/giorno) Gfar 10 1400(ml/giorno) 245(ml/giorno) Xi X far − X pla aumento della diuresi di 250 ml/giorno 43 Esempio: diuretico efficace Calcolo IC al 95%: Per stimare l’errore standard della differenza delle medie sX −X si calcola prima la stima aggregata della varianza della popolazione: 1 2 s2 = sX −X 1 2 1 1 2 2 (sfar + spla ) = (2452 + 1442 ) = 2012 2 2 s2 s2 2012 2012 = + = + = 89.9ml / giorno nfar npla 10 10 Essendo t0.05=2.101 poichè ν=2(n-1)=2(10-1)=18, IC è: 250 − 2.101 ⋅ 89.9 < µ far - µ pla < 250 + 2.101 ⋅ 89.9 61ml / giorno < µ far - µ pla < 439ml / giorno Al 95% siamo sicuri che il farmaco aumenta la diuresi di un ammontare tra 61 e 439ml/giorno 44 Osservazioni Al variare dei campioni variano gli IC Intervalli negativi indicano che i dati non ci permettono di escludere la possibilità che il farmaco faccia diminuire la produzione di urina La maggior parte degli IC contengono il valor medio rilevato sull’intera popolazione “CONFIDENZA” significa che il 95% di tutti i possibili intervalli conterrà la differenza REALE rilevata sulla popolazione 45 Ampiezza di IC α diminuisce ⇒ tα aumenta ⇒ IC più ampio ES: Calcolare IC al 90, 98% con dati precedenti Essendo t0.10 =1.734 poichè ν=18, IC al 90% è: 250 − 1.734 ⋅ 89.9 < µ far - µ pla < 250 + 1.734 ⋅ 89.9 94ml / giorno < µ far - µ pla < 410ml / giorno Essendo t0. 02 =2.552 poichè ν =18, IC al 98% è: 250 − 2.552 ⋅ 89.9 < µ far - µ pla < 250 + 2.552 ⋅ 89.9 21ml / giorno < µ far - µ pla < 479ml / giorno ATTENZIONE!!! Questo significa che ora i dati forniscono, in modo MAGICO, una stima più precisa dell’effetto del farmaco? NO! Significa che se si accetta che il 10% di tutti i possibili intervalli non contenga l’effetto vero del farmaco, allora si 46 possono ottenere intervalli più stretti. IC e verifica di ipotesi Se IC al 100(1-α)% associato con le osservazioni contiene lo ZERO ⇒ µ1= µ2 (ipotesi verificata dal t test) ⇒ non ci sono prove sufficienti per respingere l’ipotesi di inefficienza (ACCETTO H0). Se IC NON contiene lo ZERO ⇒ µ1≠ µ2 ⇒ RIFIUTO H0 ES: IC al 95% ottenuto da dati precedenti non contiene lo zero ⇒ il farmaco ha prodotto una modificazione statisticamente significativa (come trovato dal t-test) 47 IC e potenza del test Se osservassimo TUTTI i possibili IC al 95% calcolati con 10 campioni: 45% di tali IC include lo zero ovvero il 45% di essi non evidenzia il reale effetto del farmaco ⇒ il 45% delle volte incorreremmo in errore del II tipo β=0.45 e POTENZA=0.55 Perché IC? 1. Consente di rifiutare l’ipotesi di inefficacia 2. Fornisce indicazione sull’entità dell’effetto (⇒ se un risultato è significativo GRAZIE a campioni numerosi e non perché c’è un reale effetto del trattamento, allora IC lo evidenzia!) 48 Esempio: farmaco antipertensivo PROBLEMA: Dimostrare l’efficacia del farmaco antipertensivo sulla pressione diastolica Dati: si n Xi Gpla 100 81mmHg 11mmHg Gfar 100 85mmHg 9mmHg CAMPIONI H0: Non c’è differenza di pressione diastolica tra gli individui che ricevono il farmaco e quelli che ricevono il placebo 49 Esempio: farmaco antipertensivo RISOLUZIONE: T-test t= s2 = 1 2 (11 + 92 ) = 101 2 Xfar − Xpla sX far − Xpla = 81 − 85 (101 / 100) + (101 / 100) = −2.81 Fisso α=1% ed essendo ν=2(n-1)=198 ⇒ tc,198=-2.601 t < tc,198 ⇒ RIFIUTO H0 (il farmaco abbassa la pressione) IC al 95% Essendo t0.05 =1.973 poichè ν=198: − 4 − 1.973 ⋅ 1.42 < µ far - µ pla < −4 + 1.973 ⋅ 1.42 − 6.88mmHg < µ far - µ pla < −1.2mmHg Rifiuto H0, ma da IC vedo che l’effetto non è molto grande (confronto con le deviazioni standard) 50 IC per la SINGOLA media di una popolazione Quando si applica? Quando non si conosce l’incremento (per il calcolo di sX −X e X1 − X2 ) ma soltanto la MEDIA CAMPIONARIA e 1 2 l’ERRORE STANDARD della media campionaria: t= media camp. - media popolazion e X −µ = errore standard della media campionaria sX scelto tα per ν=n-1 X − tα sX < µ < X + tα sX ATTENZIONE: è consuetudine calcolare [ IC 95% = X − 2 ⋅ s , X + 2 ⋅ s X X ] perché t0.05≅2 per 20 campioni. SOTTOSTIMA di IC! 51 IC per tassi e proporzioni Z Test: differenza delle proporzion i camp. z= errore standard della diff.delle proporz. Se le dimensioni dei campioni sono sufficientemente grandi, il rapporto: z= diff.delle prop.camp. - diff.delle prop.nelle popolaz. (p̂1 - p̂2 ) - (p1 - p2 ) = errore standard della diff.delle proporz.camp. sp̂ -p̂ 1 si distribuisce in modo normale 2 Il 100(1- α)% di tutti i possibili valori di z è in ] -zα,+zα [ fissato zα, IC al 100(1- α)% è: (p̂1 - p̂2 ) − zα sp̂ -p̂ < p1 - p2 < (p̂1 - p̂2 ) + zα sp̂ -p̂ 1 2 1 2 52 Esempio: alotano/morfina Dati CAMPIONI n MORTI % Alotano 61 8 13.1 Morfina 67 10 14.9 H0: I due anestetici non sono differenti RISOLUZIONE: Calcolo l’errore standard della differenza p̂alo − p̂mor = 0.13 − 0.15 = −0.02 sp̂ alo − p̂mor 8 + 10 p̂ = = 0.14 61 + 67 1 1 1 1 = 0.14(1 − 0.14) = p̂(1 − p̂ ) + + = 0.062 = 6.2% 61 67 nalo nmor Essendo z0.05=1.960 poichè ν=∞, IC è: − 0.02 − 1.960 ⋅ 0.062 < p̂alo − p̂mor < −0.02 + 1.960 ⋅ 0.062 − 0.142 < p̂alo − p̂mor < 0.102 CONCLUSIONE: ACCETTO H0. Essendo l’intervallo quasi 53 simmetrico i due anestetici sono confrontabili IC per la SINGOLA media (caso tassi e proporzioni) Quando non si conosce l’incremento (per il calcolo di sp̂ −p̂ e p̂1 −p̂2 ) ma soltanto la MEDIA CAMPIONARIA 1 2 e l’ERRORE STANDARD della media campionaria: z= proporz.osservata - proporz. vera p̂ − p = errore standard della proporz.osservata sp̂ segue la DISTRIBUZIONE BINOMIALE Fissato zα, IC è: p̂ − zα sp̂ < p < p̂ + zα sp̂ 54 IC e approssimazione binomiale per tassi e proporzioni Se le dimensioni dei campioni NON sono sufficientemente grandi, il rapporto z non si approssima alla distribuzione normale, ma alla BINOMIALE Esempio: chirurgo e interventi Un chirurgo afferma: 30 interventi SENZA complicanze ⇒ p̂ = 0/30= 0% Per ottenere il VERO TASSO di complicanze (e non quello fortunato!) si calcola IC al 95%: IC=[pˆ − zα spˆ , pˆ + zα spˆ ] = [0, 0] p̂(1 − p̂) 0(1 − 0) sp̂ = = =0 n 30 assurdo perché non è possibile che il chirurgo non abbia mai una complicanza! IC da approssimazione BINOMIALE=]0%,10%[ 55 Esempio: chirurgo e interventi Il chirurgo ha 1 solo caso di complicanza: p̂ = 1 / 30 = 0.033% 0.033(1 − 0.033) sp̂ = = 0.033 30 IC=[pˆ − zα spˆ ,pˆ + zα spˆ ] 0.033 − 1.96 ⋅ 0.033 < p̂ < 0.033 + 1.96 ⋅ 0.033 − 0.032 < p̂ < 0.098 Un chirurgo non può ottenere COMPLICANZE NEGATIVO! un TASSO di IC da approssimazione BINOMIALE=]0%,13%[ OSSERVAZIONE: IC si estende grazie alla distribuzione binomiale quando i campioni sono pochi 56 IC per RR e OR RR e OR non si distribuiscono contrariamente a ln RR e ln OR Numerosità CAMPIONI CASI CONTR Totale Espsoti a b a+b Non esposti c d c+d a+c b+d TOTALE normalmente, RR = a /(a + b) c/(c + d) Il logaritmo naturale di RR si distribuisce normalmente con deviazione standard: 1 − a /( a + b) 1 − c /(c + d) IC − sln RR = a c ln RR − zα sln RR < ln RRvero < ln RR + zα sln RR eln RR −zα sln RR < RRvero < eln RR +zα sln RR Per verificare H0, cioè RR=1 (il trattamento o fattore di 57 rischio non ha effetto), 1∈IC IC per RR e OR CAMPIONI Numerosità CASI CONTR Esposti a b a+b Non esposti c d c+d a+c b+d TOTALE ad OR = bc Totale Il logaritmo naturale di OR si distribuisce normalmente con deviazione standard: 1 1 1 1 sln OR = + + + IC a b c d ln OR − zα sln OR < ln ORvero < ln OR + zα sln RR eln OR −zα sln OR < ORvero < eln OR +zα sln OR Per verificare H0, cioè OR=1 (l’esposizione al fattore di rischio non sia associata ad un incremento nell’OR di sviluppare la malattia), 1∈IC 58 Esempio: trombosi in soggetti riceventi emodialisi trattati con aspirina Dati n. pazienti CAMPIONI Aspirina Placebo Totale Con trombi 6 18 24 Senza trombi 13 7 20 TOTALE 19 25 44 sln RR = H0: Non c’è differenza tra placebo e aspirina RR=0.44 1 − 6 /(6 + 18) 1 − 13 /(13 + 7) − = 0.390 6 13 Essendo z0.05=1.960 poichè ν=∞, IC al 95%è: eln 0.44 −1.96⋅0.390 < RRvero < eln 0.44 +1.96⋅0.390 0.20 < RRvero < 0.94 Conclusione: Al 95% siamo confidenti che il valore vero del RR di sviluppare trombosi in soggetti che ricevono aspirina rispetto a quelli che ricevono placebo è compreso tra 59 ]0.20,0.94[. RIFIUTO H0 ,1∉IC Esempio: fumo passivo e cancro alla mammella Dati numerosità CAMPIONI CASI CONTR Totale Esposti 50 43 93 Non esposti 14 35 49 TOTALE 64 78 142 sln OR = 1 1 1 1 + + + = 0.378 a b c d H0: Il fumo passivo non aumenta l’OR di contrarre tumore alla mammella OR=2.91 Essendo z0.05=1.960 poichè ν=∞, IC al 95%è: 1.39 < RRvero < 6.10 eln 2.91−1.96⋅0.378 < RRvero < eln 2.91+1.96⋅0.378 Conclusione: Al 95% siamo confidenti che il valore vero del OR tra ]1.39,6.10[. RIFIUTO H0 ,1∉IC 60 IC per intera popolazione Popolazione (con campioni ≈ 100 o 200) che segue distribuzione normale [ IC 95%= X − 2 ⋅ s , X + 2 ⋅ s X X ] Stime della MEDIA e DS della popolazione IC IMPRECISO se popolazione rappresentata da pochi campioni ⇒ è IC di popolazione dipende da: frazione f di popolazione da comprendere grado di fiducia con cui si vuole calcolare IC numerosità del campione usato per calcolare MEDIA e DS X − Kαs < X < X + Kαs 61 IC per intera popolazione Kα ≡numero di DS campionarie da sottrarre e addizionare alla MEDIA per calcolare i limiti di IC che copre la FRAZIONE di popolazione voluta con il grado di fiducia desiderato Ruolo di Kα è analogo a quello di tα e zα ATTENZIONE! 1. Kα può essere PIU’ GRANDE di 2 campionaria tra 5 e 25! per numerosità 2. Non confondere SEM con DS e pensare che per 62 popolazione: IC 95%= X−2⋅sX,X+2⋅sX [ ] Conclusione SI a prestare attenzione al problema Accettazione/Rifiuto tipico del TEST STATISTICO ma è fondamentale valutare la FORZA con la quale le osservazioni suggeriscono un effetto (duplice controllo per l’errore di I e II tipo → POTENZA del test). Talvolta è necessario esprimere i risultati NON solo in termini di ACCETTAZIONE/RIFIUTO, ma anche stimare l’entità dell’effetto del trattamento e misurare l’imprecisione della stima (IC) 63 Funzione di Potenza per il confronto di due gruppi di numerosità n 64 Funzione di Potenza per ANOVA 65 Percentili della distribuzione normale standardizzata Es: Se si vuole ottenere una potenza dell’80% si trova zα=z0.200=-0.842 66 Tabella t-test 67 IC al 95% con approssimazione binomiale 68