lezioni - Facoltà di Medicina e Chirurgia

Potenza di un test e
Intervalli di confidenza
1
Indice
Definizione di potenza di un test e dei parametri da
cui dipende
Potenza e ampiezza campionaria
Analisi della varianza
Confronto di due proporzioni
RR e OR
Tabelle di contingenza
Definizione di IC ed applicazione nella verifica
delle ipotesi
IC per:
Media di una popolazione
Tassi e proporzioni
RR e OR
Intera popolazione
2
Riepilogo sull’uso dei test
Ipotesi per la applicazione di un test:
H0 vera
quando i dati hanno BASSA probabilità
verificarsi, RIFIUTIAMO H0 e concludiamo che
di
c’è differenza STATISTICAMENTE
SIGNIFICATIVA tra i trattamenti
3
Riepilogo sull’uso dei test
Analogamente
quando i dati hanno ALTA probabilità di verificarsi,
ACCETTIAMO H0 e concludiamo che
NON c’è differenza STATISTICAMENTE
SIGNIFICATIVA tra i trattamenti
porta a discutere
i risultati come se
il trattamento non ha effetto
PROBLEMA:
Non è stato dimostrata l’EFFICACIA del trattamento
dimensione
dell’effetto
variabilità della
popolazione
numerosità dei
campioni 4
Esempio: diuretico efficace
PROBLEMA:
Dimostrare l’efficacia di un nuovo diuretico
FASE SPERIMENTALE:
1) G=20 us
Gc =10 us → placebo
Gt =10 us → farmaco
2) Misura di diuresi dopo 24h
H0:
Non c’è differenza tra Gc e Gt
ATTENZIONE!!!!!!
Ipotesi nel t-test: H0 vera (il trattamento NON è efficace)
Ipotesi ora:
H0 falsa (il trattamento E’ efficace)
5
Esempio: diuretico efficace
RISULTATO:
Media ± DS
Gc
Gt
600
800
1000
1200
1400
1600
1800
2000
diuresi (ml/giorno)
Gc: MEDIA=1180ml/giorno, DS=144ml/giorno
Gt: MEDIA=1400ml/giorno, DS=245ml/giorno
eseguo il t-test
6
Esempio: diuretico efficace
T-test (H0 falsa):
1
1 2
2
s = sGc + sGt = (1442 + 2452 ) = 2012
2
2
2
t=
(s
(
)
XGt − XGc
2
/ nGt ) + (s / nGc )
2
=
1400 − 1180
(201
2
/ 10 ) + (201 / 10 )
2
= 2.447
Fisso α=5% ed essendo ν=2(n-1)=18 ⇒tc,18=2.101
t > tc
ovvero, il farmaco ha AUMENTATO la diuresi
VERO!!!!
7
Esempio: diuretico efficace
Sotto ipotesi H0 falsa, cambio il campione
RISULTATO:
Media ± DS
Gc
Gt
600
800
1000
1200
1400
1600
1800
2000
diuresi (ml/giorno)
Gc: MEDIA=1216ml/giorno, DS=97ml/giorno
Gt: MEDIA=1368ml/giorno, DS=263ml/giorno
eseguo il t-test
8
Esempio: diuretico efficace
T-test:
1
1 2
2
s = sGc + sGt = (2632 + 97 2 ) = 1982
2
2
2
t=
(s
(
)
XGt − XGc
2
/ nGt ) + (s / nGc )
2
=
1368 − 1216
(198
2
/ 10 ) + (198 / 10 )
2
= 1.71
Fisso α=5% ed essendo ν=2(n-1)=18 ⇒ tc,18=2.101
t < tc
ovvero, il farmaco NON ha AUMENTATO la diuresi
9
FALSO!!!!
Osservazione
Nell’applicazione di un test
PROBLEMA: evitare di rifiutare l’ipotesi di inefficacia,
quando essa in realtà è vera, cioè
controllare la probabilità di ottenere dei
FALSI POSITIVI
Ora si vuole
non rifiutare l’ipotesi di inefficacia, quando
essa in realtà è falsa, cioè controllare la
probabilità di ottenere dei
FALSI NEGATIVI
Qual è la probabilità di compiere questo secondo
tipo di errore?
10
Risposta intuitiva
Sotto l’ipotesi che il farmaco è EFFICACE, ripetiamo
l’esperimento 200 volte (si riportano i valori del t-test)
H0 vera α=5%
H0 falsa
111 valori di t sono > tc =2.101
Con α=5%, c’è una probabilità pari a 111/200=55% di concludere
che il diuretico aumenta la produzione di urina quando questa in
media aumenta di 200ml/giorno
La POTENZA del test è 0.55 e quantifica la
11
PROBABILITA’ di rilevare una differenza reale
Tipi di conclusione nel
test di ipotesi
CONCLUSIONI
tratte dalle
OSSERVAZIONI
SITUAZIONE REALE
TRATTAMENTO è
EFFICACE
TRATTAMENTO è
INEFFICACE
Trattamento è
efficace
Vero Positivo
Conclusione corretta (1-β)
Falso positivo
Errore di tipo I (α)
Trattamento è
inefficace
Falso negativo
Errore di tip II (β)
Vero negativo
Conclusione corretta (1- α)
La POTENZA di un test è (1-β)
ovvero Es:
Un test con potenza 0.55, significa che c’è una probabilità
del 55% di evidenziare come statisticamente significativo un
effetto che esiste realmente
12
Potenza di un test
Gli errori di I e II tipo sono interdipendenti:
prove più stringenti per dichiarare che un farmaco ha
effetto (RIDURRE α) determina aumento della
probabilità di NON rilevare l’effetto vero
(AUMENTO β) ovvero si RIDUCE la POTENZA
Per rendere PICCOLI sia α che β si deve:
AUMENTARE LA NUMEROSITA’ CAMPIONARIA,
poiché con più osservazioni si può avere maggiore
fiducia nelle conclusioni
13
Potenza di un test
I fattori da cui dipende la POTENZA di un test sono:
la dimensione dell’errore di I tipo α
la dimensione della differenza che si vuole
rilevare, relativamente alla variabilità della
popolazione
la numerosità del campione
14
Dimensione dell’errore α
Il
VALORE
CRITICO
è
determinato dalla distribuzione del
test statistico sotto ipotesi: H0
VERA
La POTENZA è la proporzione dei
valori possibili del test che cadono
oltre questa soglia sotto ipotesi: H0
FALSA
ATTENZIONE!!!
La Gaussiana cambia perché il trattamento modifica il valor medio
La POTENZA è 0.55
o equivalentemente
β (la probabilità di incorrere in un errore di II tipo e
accettare l’ipotesi di inefficacia quando esiste un effetto) è
15
1-0.55=0.45=45%
Dimensione dell’errore α
Esigiamo prove più convincenti per concludere che il
diuretico è efficace.
La Potenza scende a 0.45!
Per avere prove più convincenti, abbiamo ridotto la
probabilità di concludere erroneamente circa l’efficacia (α),
ma abbiamo accresciuto il rischio di non riuscire a rilevare
l’effetto quando esiste (β) perché abbiamo ridotto la
16
potenza.
Dimensione della differenza
Se l’effetto da evidenziare cambia, cambiano anche la
Gaussiana e la POTENZA.
E’ più facile rilevare
differenze grandi che
piccole.
17
Funzione di potenza
Ripetendo l’operazione per tutti i possibili valori
dell’effetto del trattamento: FUNZIONE di POTENZA
Es: Se il farmaco aumenta la
produzione
di
urina
di
200ml/giorno,
c’è
una
probabilità del 55% di
rilevarlo
Misura
quanto
più
facilmente si rileva una
modificazione di urina, al
crescere dell’effetto del
farmaco
18
Variabilità della popolazione
La variabilità della popolazione influenza la probabilità di
riuscire ad evidenziare l’effetto di un trattamento.
Formula del t-test:
t=
X1 − X2
X1 − X2
δ n
=
=
=
2
2
2/n σ 2
(s / n1 ) + (s / n2 ) σ 2 / n
n1=n2
s (variabilità della popolazione)
diminuisce
↑ ↓
potenza del test nel rilevare un
effetto aumenta
δ/σ
Posto
δ = X1 − X2
Parametro di NON
CENTRALITA’, Φ
si quantifica
19
Numerosità del campione
La POTENZA aumenta all’aumentare della numerosità del
campione perché:
aumenta il numero
di GL e il valore
critico diminuisce
il valore di t
calcolato aumenta al
crescere di n
δ n
t=
σ 2
20 us ⇒ν=2(20-1)=38 GL
20
Funzione di potenza
Ripetendo
l’operazione
con
diverse
numerosità
campionarie, fissato l’incremento medio: FUNZIONE di
POTENZA
All’aumentare
della
numerosità cresce la
potenza
Il
calcolo
della
POTENZA
viene
utilizzato per stimare
la
DIMENSIONE
CAMPIONARIA
necessaria per rilevare
un effetto.
21
Funzione di potenza
Curve di POTENZA del t-test per il confronto di due
gruppi sperimentali con numerosità n e α=0.05
ES: Calcolare la POTENZA
del t-test con un rischio di
errore del I tipo α =0.05,
utilizzato per rilevare una
modificazione media di urina
di
200ml/giorno
in
una
popolazione con deviazione
standard di 200ml/giorno
δ 200
Φ= =
= 1 n=10
σ 200
Potenza=0.55
22
Esempio: alotano/morfina
Dati:
si
CAMPIONI
n
G1:us con ALOTANO
9
2.08(l/m2)
1.05(l/m2)
G2:us con MORFINA
16
1.75(l/m2)
0.88(l/m2)
Xi
T-test: alotano e morfina non producono risultati
significativamente differenti dell’indice cardiaco, vista
la differenza del 15% fra gli indici cardiaci associati con
questi due anestetici (2.08-2.08*x=1.75 ⇒x=15%)
Tesi:
Qual è la potenza di questo esperimento se si vuole
rilevare una differenza del 25% che può essere
clinicamente significativa?
23
Esempio: alotano/morfina
Risoluzione:
Una differenza del 25% dell’indice
corrisponde a 0.52l/m2 (=25% di 2.08 l/m2).
cardiaco
δ
Calcoliamo il parametro di NON CENTRALITA’: Φ =
σ
2
2
( 9 − 1)(1 .05 ) + (16 − 1)( 0 .88 )
s =
= 0 .89 (l / m 2 ) 2
9 + 16 − 2
2
0 .52
Φ =
= 0 .553
0 .89
I due gruppi hanno numerosità diverse ⇒ si sceglie il
gruppo più piccolo ⇒ la potenza è 0.16
Conclusione:
E’ molto improbabile che questa sperimentazione rilevi
una modificazione del 25%
24
Riepilogo
La potenza di un test indica che l’ipotesi di inefficacia
del trattamento sia rifiutata, se il trattamento ha
effetto
Tanto più stringenti sono le prove che esigiamo per
affermare l’efficacia di un trattamento, tanto più bassa
è la potenza del test
Quanto più grande è la numerosità del campione, tanto
maggiore è la potenza del test
La procedura specifica per determinare la potenza di un
test dipende dal test stesso
25
Calcolo della potenza e ampiezza
campionaria per ANOVA
OSSERVAZIONE:
Questi calcoli si differenziano solo per:
1. il MODO in cui viene
dell’effetto del trattamento
2. la RELAZIONE
grandezza
quantificata
MATEMATICA
tra
l’entità
questa
3. il rischio di concludere erroneamente che c’è un
effetto del trattamento.
26
Potenza per ANOVA
δ n
1. Si calcola Φ =
σ 2k
numero di gruppi di trattamento
se i k-gruppi hanno medie µi diverse Φ =
con µ =
∑µ
i
i
n ∑ ( µ i − µ) 2
i
s2k
k
2. Si determina νn=k-1 e νd=k(n-1)
3. Si consulta il diagramma di potenza opportuno
27
Ampiezza campionaria per ANOVA
ATTENZIONE!!!
L’ampiezza campionaria compare in Φ e in vd
Per trovare l’ampiezza campionaria n bisogna fare vari
tentativi:
→ si fissa n e si calcola la potenza
→ si corregge fino a quando la potenza calcolata è
vicina al valore desiderato
28
Esempio: ciclo mestruale e corsa
PROBLEMA:
Capire se le donne che corrono da dilettanti o da
professioniste hanno andamenti mestruali differenti
dalle donne che conducono vita sedentaria.
Si vuole rilevare una differenza di δ=1 ciclo
mestruale/anno con σ=2 cicli/anno, k=3 (Gdil, Gprof,
Gcon), n=26 e α=5%
1
Φ=
2
Risoluzione:
26
= 1 .04 νn=3-1=2 e νd=3(26-1)=75
2 ⋅3
Potenza=0.32
29
Esempio: ciclo mestruale e corsa
PROBLEMA:
Si vuole aumentare la potenza a 0.80. Quanti campioni
devo scegliere?
Risoluzione:
Sappiamo che con 26 ho potenza 0.32. Guardo la curva
Per potenza di 0.80
devo avere Φ≅2 ⇒ n è
sotto radice nella
definizione di Φ ⇒
aumento n di un
fattore 4
30
Esempio: ciclo mestruale e corsa
1 100
Φ=
= 2 .04
2 2 ⋅3
νn=3-1=2 e νd=3(100-1)=297
Potenza=0. 90
Per avere la potenza desiderata, scegliamo n=75:
1
Φ=
2
75
= 1 .77
2 ⋅3
Potenza=0.80
ν n=3-1=2 e νd=3(75-1)=222
Conclusione:
Per avere una probabilità dell’80% di rilevare un
cambiamento di 1 ciclo/anno fra i 3 gruppi di donne quando
la deviazione standard è circa 2cicli/anno con un livello di
31
confidenza del 95%, occorrono 75 us.
Potenza per confronto di due proporzioni
OBIETIVO:
Trovare la potenza del test z per valutare la differenza
tra due proporzioni p1ep2 di numerosità n1 e n2
Test z:
p1 − p2
z=
sp1 −p2
che si distribuisce come una distribuzione normale con
media p1 − p2 e deviazione standard
sp1 −p2 =
p1 (1 − p1 ) p2 (1 − p2 )
+
n1
n2
32
Potenza per confronto di due proporzioni
Distribuzione di tutti i
differenze osservate p̂1 e p̂2
possibili
valori
delle
Potenza: (1-β)*100%
della
distribuzione
deve essere oltre la
soglia
H0 VERA
(p1-p2)+zβ(1)sp1-p2
Percentile inferiore
della
normale
standardizzata
Si ottiene una potenza del (1-β)*100%
ipotesi con significatività α*100% se
(p1-p2)+zβ(1)sp1-p2=zαs0
per il rifiuto di
33
Potenza per confronto di due proporzioni
La potenza del test è data dalla seguente probabilità:
zα s0 − (p1 − p2 )
zβ(1) =
sp1 −p2
Esempio: alotano/morfina
Tesi:
Dati
CAMPIONI
n
MORTI
Alotano
61
8
13.1
Morfina
67
10
14.9
% totale morti=
%
Qual è la potenza se si vuole
evidenziare una differenza
del 30% con una confidenza
del 95%?
8 + 10
= 0.141 = 14%
61 + 67
Si vuole evidenziare
differenza del 30%
34
Esempio: alotano/morfina
Differenza del 30%= (8 + 16) − (8 + 16) * 30 / 100 = 0.098 = 10%
61 + 67
Quindi p1=0.14 (è la proporzione che quantifica il totale
dei morti) e p2=0.10 (è la proporzione che quantifica la
differenza del 30%); n1=61 e n2=67
0.14(1 − 0.14) 0.10(1 − 0.10)
sp1 −p2 =
+
= 0.0576
61
67
p n + p2n2
Essendo p̂ = 1 1
= 0.119 calcolo s0:
n1 + n2
s0 =
p̂(1 − p̂ ) p̂(1 − p̂ )
+
=
n1
n2
0.119(1 − 0.119) 0.119(1 − 0.119)
+
= 0.0573
61
67
35
Esempio: alotano/morfina
Fissato α=0.05 ⇒zc=1.96 ⇒ POTENZA è data dalla
frazione di distribuzione superiore a :
zβ(1) =
1.96 ⋅ 0.0573 − (0.14 − 0.10)
= 1.255
0.0576
POTENZA=11%
Conclusione:
La potenza è bassa quindi la differenza tra i due
anestetici non è significativa.
36
Potenza e numerosità campionaria per
RR e OR
Le formule precedenti sono utilizzate per stimare
POTENZA e NUMEROSITA’ CAMPIONARIA per
RR e OR.
Non si specificano entrambe le proporzioni ma solo
una (p1) e l’altra si ricava:
RR =
pesposti/(1 − pesposti)
pesposti
pnon esposti
=
p2
p1
p2 /(1 − p2 )
OR =
=
pnon esposti/(1 − pnon esposti) p1 /(1 − p1 )
⇒
p2 = RR ⋅ p1
⇒
OR ⋅ p1
p2 =
1 + p1 (OR − 1)
37
Finalità e limiti delle tecniche statistiche
FINALITA’:
Decidere se un insieme di osservazioni è compatibile
con una certa ipotesi (probabilità e potenza del test)
LIMITI:
non quantificano l’entità dell’effetto
non mettono in evidenza risultati che possono non
essere statisticamente significativi
OBIETTIVO:
stimare l’entità dell’effetto del trattamento
Intervalli di Confidenza (IC)
38
IC per differenza di due medie
T-test:
differenza delle medie campionarie
t=
errore standard della differenza delle medie
eseguo il test.
Campioni estratti da
stessa popolazione
la distribuzione dei
valori di t ha MEDIA=0
SIMMETRICA rispetto
ad origine
Campioni estratti da
popolazioni diverse
la distribuzione dei
valori di t ha MEDIA≠0
che dipende dall’entità
dell’effetto
del
trattamento
39
IC per differenza di due medie
Per avere MEDIA=0 a prescindere dall’efficacia del
trattamento:
diff. medie camp. - diff.vera medie popolazioni
t=
errore standard della differenza delle medie camp.
(X1 - X2 ) - (µ1 - µ2 )
=
sX −X
1
2
incognita
Se H0 VERA (campioni
estratti
da
stessa
popolazione) µ1=µ2 ⇔ def
precedente di t
Scelto un appropriato valore di t, tα, stimiamo incognita
usando l’equazione precedente.
COME?
40
IC per differenza di due medie
Per DEF:
il 100α% di tutti i possibili valori di t comprende valori
MINORI di -tα e MAGGIORI di +tα
1- α
α
-tα
+tα
Il 100(1- α)% di tutti i possibili valori di t è in ] -tα,+tα [
ES: il 95% dei possibili valori di t è in ] –t0.05,+t0.05 [
(X1 - X2 ) - (µ1 - µ2 )
− tα <
< +tα
sX −X
1
2
41
IC per differenza di due medie
DEF:
Intervallo di Confidenza per la differenza delle medie
al 100(1- α)% è:
(X1 - X2 ) − tα sX −X < µ1 - µ2 < (X1 - X2 ) + tα sX −X
1
2
1
2
la differenza vera delle medie delle popolazioni dalle
quali provengono i campioni cade ad una distanza dalla
differenza osservata delle medie campionarie inferiore
a tα volte la deviazione standard delle medie
campionarie
Gradi di
Distribuzione dipende da
Libertà
n. di campioni estratti
numerosità di ciascun campione(GL)
distribuzione della popolazione dalla
quale i campioni sono estratti
ATTENZIONE!
tα ha ν=n1+n2-2 GL
i campioni devono essere estratti da popolazioni
che seguono una distribuzione normale
42
Esempio: diuretico efficace
CASO IDEALE:
TUTTA la popolazione di 200 individui è accessibile. Si
misura la produzione media di urina.
Tutti sono trattati con placebo ⇒ µpla=1200ml/giorno
Tutti sono trattati con farmaco ⇒ µfar=1400ml/giorno
µ pla- µ far=200ml/giorno
CASO REALE:
Sono accessibili solo 10 campioni!
Dati:
si
CAMPIONI
n
Gpla
10
1150(ml/giorno)
144(ml/giorno)
Gfar
10
1400(ml/giorno)
245(ml/giorno)
Xi
X far − X pla
aumento della
diuresi di 250
ml/giorno 43
Esempio: diuretico efficace
Calcolo IC al 95%:
Per stimare l’errore standard della differenza delle
medie sX −X
si calcola prima la stima aggregata della
varianza della popolazione:
1
2
s2 =
sX −X
1
2
1
1 2
2
(sfar + spla
) = (2452 + 1442 ) = 2012
2
2
s2
s2
2012 2012
=
+
=
+
= 89.9ml / giorno
nfar npla
10
10
Essendo t0.05=2.101 poichè ν=2(n-1)=2(10-1)=18, IC è:
250 − 2.101 ⋅ 89.9 < µ far - µ pla < 250 + 2.101 ⋅ 89.9
61ml / giorno < µ far - µ pla < 439ml / giorno
Al 95% siamo sicuri che il farmaco aumenta la diuresi di un
ammontare tra 61 e 439ml/giorno
44
Osservazioni
Al variare dei campioni variano gli IC
Intervalli negativi indicano che i dati non ci
permettono di escludere la possibilità che il farmaco
faccia diminuire la produzione di urina
La maggior parte degli IC contengono il valor medio
rilevato sull’intera popolazione
“CONFIDENZA” significa che il 95% di
tutti i possibili intervalli conterrà la
differenza
REALE
rilevata
sulla
popolazione
45
Ampiezza di IC
α diminuisce ⇒ tα aumenta ⇒ IC più ampio
ES: Calcolare IC al 90, 98% con dati precedenti
Essendo t0.10 =1.734 poichè ν=18, IC al 90% è:
250 − 1.734 ⋅ 89.9 < µ far - µ pla < 250 + 1.734 ⋅ 89.9
94ml / giorno < µ far - µ pla < 410ml / giorno
Essendo t0. 02 =2.552 poichè ν =18, IC al 98% è:
250 − 2.552 ⋅ 89.9 < µ far - µ pla < 250 + 2.552 ⋅ 89.9
21ml / giorno < µ far - µ pla < 479ml / giorno
ATTENZIONE!!!
Questo significa che ora i dati forniscono, in modo
MAGICO, una stima più precisa dell’effetto del farmaco?
NO! Significa che se si accetta che il 10% di tutti i possibili
intervalli non contenga l’effetto vero del farmaco, allora si
46
possono ottenere intervalli più stretti.
IC e verifica di ipotesi
Se IC al 100(1-α)% associato con le osservazioni
contiene lo ZERO ⇒ µ1= µ2 (ipotesi verificata dal t test)
⇒ non ci sono prove sufficienti per respingere l’ipotesi
di inefficienza (ACCETTO H0).
Se IC NON contiene lo ZERO ⇒ µ1≠ µ2 ⇒ RIFIUTO H0
ES: IC al 95% ottenuto da dati precedenti non
contiene lo zero ⇒ il farmaco ha prodotto una
modificazione statisticamente significativa (come
trovato dal t-test)
47
IC e potenza del test
Se osservassimo TUTTI i possibili IC al 95% calcolati
con 10 campioni:
45% di tali IC include lo zero
ovvero il 45% di essi non evidenzia il reale effetto del
farmaco ⇒ il 45% delle volte incorreremmo in errore
del II tipo
β=0.45 e POTENZA=0.55
Perché IC?
1. Consente di rifiutare l’ipotesi di inefficacia
2. Fornisce indicazione sull’entità dell’effetto
(⇒ se un risultato è significativo GRAZIE a campioni numerosi e non
perché c’è un reale effetto del trattamento, allora IC lo evidenzia!)
48
Esempio: farmaco antipertensivo
PROBLEMA:
Dimostrare l’efficacia del farmaco antipertensivo sulla
pressione diastolica
Dati:
si
n
Xi
Gpla
100
81mmHg
11mmHg
Gfar
100
85mmHg
9mmHg
CAMPIONI
H0:
Non c’è differenza di pressione diastolica tra gli
individui che ricevono il farmaco e quelli che ricevono il
placebo
49
Esempio: farmaco antipertensivo
RISOLUZIONE:
T-test
t=
s2 =
1 2
(11 + 92 ) = 101
2
Xfar − Xpla
sX
far − Xpla
=
81 − 85
(101 / 100) + (101 / 100)
= −2.81
Fisso α=1% ed essendo ν=2(n-1)=198 ⇒ tc,198=-2.601
t < tc,198 ⇒ RIFIUTO H0 (il farmaco abbassa la pressione)
IC al 95%
Essendo t0.05 =1.973 poichè ν=198:
− 4 − 1.973 ⋅ 1.42 < µ far - µ pla < −4 + 1.973 ⋅ 1.42
− 6.88mmHg < µ far - µ pla < −1.2mmHg
Rifiuto H0, ma da IC
vedo che l’effetto
non è molto grande
(confronto con le
deviazioni standard)
50
IC per la SINGOLA media di una
popolazione
Quando si applica?
Quando non si conosce l’incremento (per il calcolo di
sX −X e X1 − X2 ) ma soltanto la MEDIA CAMPIONARIA e
1
2
l’ERRORE STANDARD della media campionaria:
t=
media camp. - media popolazion e
X −µ
=
errore standard della media campionaria
sX
scelto tα
per ν=n-1
X − tα sX < µ < X + tα sX
ATTENZIONE: è consuetudine calcolare
[
IC 95% = X − 2 ⋅ s , X + 2 ⋅ s
X
X
]
perché t0.05≅2 per 20 campioni. SOTTOSTIMA di IC! 51
IC per tassi e proporzioni
Z Test:
differenza delle proporzion i camp.
z=
errore standard della diff.delle proporz.
Se le dimensioni dei campioni sono sufficientemente
grandi, il rapporto:
z=
diff.delle prop.camp. - diff.delle prop.nelle popolaz. (p̂1 - p̂2 ) - (p1 - p2 )
=
errore standard della diff.delle proporz.camp.
sp̂ -p̂
1
si distribuisce in modo normale
2
Il 100(1- α)% di tutti i possibili valori di z è in ] -zα,+zα [
fissato zα,
IC al 100(1- α)% è:
(p̂1 - p̂2 ) − zα sp̂ -p̂ < p1 - p2 < (p̂1 - p̂2 ) + zα sp̂ -p̂
1
2
1
2
52
Esempio: alotano/morfina
Dati
CAMPIONI
n
MORTI
%
Alotano
61
8
13.1
Morfina
67
10
14.9
H0:
I due anestetici non sono
differenti
RISOLUZIONE:
Calcolo l’errore standard della differenza
p̂alo − p̂mor = 0.13 − 0.15 = −0.02
sp̂
alo − p̂mor
8 + 10
p̂ =
= 0.14
61 + 67
 1
1 
1
1 
 = 0.14(1 − 0.14)
= p̂(1 − p̂ )
+
+
 = 0.062 = 6.2%

 61 67 
 nalo nmor 
Essendo z0.05=1.960 poichè ν=∞, IC è:
− 0.02 − 1.960 ⋅ 0.062 < p̂alo − p̂mor < −0.02 + 1.960 ⋅ 0.062
− 0.142 < p̂alo − p̂mor < 0.102
CONCLUSIONE: ACCETTO H0. Essendo l’intervallo quasi
53
simmetrico i due anestetici sono confrontabili
IC per la SINGOLA media
(caso tassi e proporzioni)
Quando non si conosce l’incremento (per il calcolo di
sp̂ −p̂ e p̂1 −p̂2 ) ma soltanto la MEDIA CAMPIONARIA
1
2
e l’ERRORE STANDARD della media campionaria:
z=
proporz.osservata - proporz. vera
p̂ − p
=
errore standard della proporz.osservata
sp̂
segue la DISTRIBUZIONE BINOMIALE
Fissato zα, IC è:
p̂ − zα sp̂ < p < p̂ + zα sp̂
54
IC e approssimazione binomiale
per tassi e proporzioni
Se
le
dimensioni
dei
campioni
NON
sono
sufficientemente grandi, il rapporto z non si approssima
alla distribuzione normale, ma alla BINOMIALE
Esempio: chirurgo e interventi
Un chirurgo afferma: 30 interventi SENZA complicanze
⇒ p̂ = 0/30= 0%
Per ottenere il VERO TASSO di complicanze (e non
quello fortunato!) si calcola IC al 95%:
IC=[pˆ − zα spˆ , pˆ + zα spˆ ] = [0, 0]
p̂(1 − p̂)
0(1 − 0)
sp̂ =
=
=0
n
30
assurdo perché non è possibile
che il chirurgo non abbia mai
una complicanza!
IC da approssimazione BINOMIALE=]0%,10%[
55
Esempio: chirurgo e interventi
Il chirurgo ha 1 solo caso di complicanza: p̂ = 1 / 30 = 0.033%
0.033(1 − 0.033)
sp̂ =
= 0.033
30
IC=[pˆ − zα spˆ ,pˆ + zα spˆ ]
0.033 − 1.96 ⋅ 0.033 < p̂ < 0.033 + 1.96 ⋅ 0.033
− 0.032 < p̂ < 0.098
Un chirurgo non può ottenere
COMPLICANZE NEGATIVO!
un
TASSO
di
IC da approssimazione BINOMIALE=]0%,13%[
OSSERVAZIONE:
IC si estende grazie alla distribuzione binomiale quando i
campioni sono pochi
56
IC per RR e OR
RR e OR non si distribuiscono
contrariamente a ln RR e ln OR
Numerosità
CAMPIONI
CASI
CONTR
Totale
Espsoti
a
b
a+b
Non esposti
c
d
c+d
a+c
b+d
TOTALE
normalmente,
RR =
a /(a + b)
c/(c + d)
Il logaritmo naturale di RR si distribuisce normalmente
con deviazione standard:
1 − a /( a + b) 1 − c /(c + d)
IC
−
sln RR =
a
c
ln RR − zα sln RR < ln RRvero < ln RR + zα sln RR
eln RR −zα sln RR < RRvero < eln RR +zα sln RR
Per verificare H0, cioè RR=1 (il trattamento o fattore di
57
rischio non ha effetto), 1∈IC
IC per RR e OR
CAMPIONI
Numerosità
CASI
CONTR
Esposti
a
b
a+b
Non esposti
c
d
c+d
a+c
b+d
TOTALE
ad
OR =
bc
Totale
Il logaritmo naturale di OR si distribuisce normalmente
con deviazione standard:
1 1 1 1
sln OR =
+ + +
IC
a
b
c
d
ln OR − zα sln OR < ln ORvero < ln OR + zα sln RR
eln OR −zα sln OR < ORvero < eln OR +zα sln OR
Per verificare H0, cioè OR=1 (l’esposizione al fattore di
rischio non sia associata ad un incremento nell’OR di
sviluppare la malattia), 1∈IC
58
Esempio: trombosi in soggetti riceventi
emodialisi trattati con aspirina
Dati
n. pazienti
CAMPIONI
Aspirina
Placebo
Totale
Con trombi
6
18
24
Senza trombi
13
7
20
TOTALE
19
25
44
sln RR =
H0:
Non c’è differenza
tra
placebo
e
aspirina
RR=0.44
1 − 6 /(6 + 18) 1 − 13 /(13 + 7)
−
= 0.390
6
13
Essendo z0.05=1.960 poichè ν=∞, IC al 95%è:
eln 0.44 −1.96⋅0.390 < RRvero < eln 0.44 +1.96⋅0.390
0.20 < RRvero < 0.94
Conclusione:
Al 95% siamo confidenti che il valore vero del RR di
sviluppare trombosi in soggetti che ricevono aspirina
rispetto a quelli che ricevono placebo è compreso tra
59
]0.20,0.94[. RIFIUTO H0 ,1∉IC
Esempio: fumo passivo e cancro alla mammella
Dati
numerosità
CAMPIONI
CASI
CONTR
Totale
Esposti
50
43
93
Non esposti
14
35
49
TOTALE
64
78
142
sln OR =
1 1 1 1
+ + + = 0.378
a b c d
H0:
Il fumo passivo non
aumenta l’OR di
contrarre tumore
alla mammella
OR=2.91
Essendo z0.05=1.960 poichè ν=∞, IC al 95%è:
1.39 < RRvero < 6.10
eln 2.91−1.96⋅0.378 < RRvero < eln 2.91+1.96⋅0.378
Conclusione:
Al 95% siamo confidenti che il valore vero del OR tra
]1.39,6.10[. RIFIUTO H0 ,1∉IC
60
IC per intera popolazione
Popolazione (con campioni ≈ 100 o 200) che segue
distribuzione normale
[
IC 95%= X − 2 ⋅ s , X + 2 ⋅ s
X
X
]
Stime della MEDIA e DS della popolazione
IC IMPRECISO se popolazione
rappresentata da pochi campioni
⇒
è
IC di popolazione dipende da:
frazione f di popolazione da comprendere
grado di fiducia con cui si vuole calcolare IC
numerosità del campione usato per calcolare MEDIA e
DS
X − Kαs < X < X + Kαs
61
IC per intera popolazione
Kα ≡numero
di DS campionarie da sottrarre e
addizionare alla MEDIA per calcolare i limiti di IC
che copre la FRAZIONE di popolazione voluta con il
grado di fiducia desiderato
Ruolo di Kα è
analogo a quello
di tα e zα
ATTENZIONE!
1. Kα può essere PIU’ GRANDE di 2
campionaria tra 5 e 25!
per numerosità
2. Non confondere SEM con DS e pensare che per
62
popolazione: IC 95%= X−2⋅sX,X+2⋅sX
[
]
Conclusione
SI a prestare attenzione al problema
Accettazione/Rifiuto tipico del TEST STATISTICO
ma è fondamentale valutare la FORZA con la quale le
osservazioni suggeriscono un effetto (duplice controllo
per l’errore di I e II tipo → POTENZA del test).
Talvolta è necessario esprimere i risultati NON solo in
termini di ACCETTAZIONE/RIFIUTO, ma anche
stimare l’entità dell’effetto del trattamento e misurare
l’imprecisione della stima (IC)
63
Funzione di Potenza per il confronto di
due gruppi di numerosità n
64
Funzione di Potenza per ANOVA
65
Percentili della distribuzione normale
standardizzata
Es: Se si vuole ottenere una potenza dell’80% si trova
zα=z0.200=-0.842
66
Tabella t-test
67
IC al 95% con approssimazione binomiale
68