PPT - Formazione e Sicurezza

Considerazioni statistiche
Prima di iniziare uno studio
• calcolo della potenza. Per evitare di fare uno studio
che abbia poca probabilità di dimostrare come
statisticamente significativo l'effetto vero di un
intervento
Alla fine dello studio
• analisi statistica dei dati. Una riduzione del tasso di
infortunio più grande nel gruppo di intervento che
nel gruppo di confronto basta per dimostrare che
l'intervento ha funzionato? No, perchè i dati nella
vita reale sono soggetti a variabilità casuale.
Errori del test statistico
Realtà
Vero
Test
statistico
Errore
tipo I
Vero
Falso
Falso
Errore
tipo II
Errori di I tipo e probabilità dell’errore
(p-value)
Realtà
Vero
Test
statistico
Errore
tipo I
Vero
Falso
Falso
Errore
tipo II
Probabilità α
p-value alfa (errore I tipo)
L'analisi statistica produce un p-value che può
essere interpretato come:
La probabilità che una differenza ampia almeno
quanto quella osservata si sarebbe potuta
produrre semplicemente per caso, se
veramente non ci fosse un effetto reale
dell'intervento.
p-value (errore alfa)
Realtà
Vero
Test
statistico
Errore
tipo I
Vero
Falso
Falso
Errore
tipo II
α < 0.05
Errore di II tipo e probabilità Beta
Se il programma ha in realtà un effetto
moderato, ma la differenza non è statisticamente
significativa, in tal caso non si rifiuta (cioè si
accetta) l’ipotesi iniziale di “nessuna differenza”
mentre in realtà questa differenza esiste.
Questo errore è conosciuto come errore tipo II.
La probabilità che si verifichi tale errore, cioè, la
probabilità che non riusciate a rifiutare l'ipotesi
quando è falsa, è conosciuta come β.
Errore II tipo e p-value di Beta
Realtà
Vero
Test
statistico
Errore
tipo I
Vero
Falso
Probabilità
β
Falso
Errore
tipo II
Errore II tipo e p-value di Beta
Realtà
Vero
Test
statistico
Errore
tipo I
Vero
Falso
β  0.10
Falso
Errore
tipo II
Potenza dello studio
La probabilità di rifiutare correttamente un'ipotesi
falsa, cioè di evidenziare l'efficacia del
programma quando questo ha avuto un effetto
vero, è 1- β.
Questo valore è conosciuto come potenza dello
studio.
Prima di intraprendere l'intervento è importante considerare
la potenza dello studio, per essere ragionevolmente sicuri di
concludere che esiste una differenza se veramente questa
esiste (e quindi evitare di fare uno studio che abbia poca
probabilità di dimostrare l'effetto vero di un intervento)
Ciò può essere fatto in due modi:
• prima decidere la potenza desiderata e poi calcolare la
dimensione del campione necessario
• oppure, disponendo di un determinato numero di operai
che potrebbero partecipare allo studio, valutare la
potenza che lo studio avrebbe con quel numero
Il primo metodo è preferibile. Tipicamente, i ricercatori
progettano le valutazioni in modo che la potenza sia
80% (a volte 90%); cioè se l'intervento è veramente
efficace, vi è una probabilità di 80% (90%) che i dati
raccolti e i test statistici usati vi permettano di
concludere che l'intervento è efficace.
Nella pratica, gli interventi nei posti di lavoro
coinvolgono solitamente un numero fisso di operai
(quelli di un impianto o di un reparto). Così non si può
decidere in anticipo la potenza, ma solo di controllare
con quale potenza si opera
Parecchi elementi entrano nel calcolo della potenza:
• la dimensione dell’effetto, quale effetto dovrebbe avere
l'intervento per valere la pena di fare l’intervento e di
riproporlo altrove
• dimensione del campione, numero di partecipanti alla
valutazione o, più formalmente, di unità sperimentali
• variabilità delle misure all'interno del campione
• valori assegnati per α e β.
• tipo di dati raccolti (quantitativi o qualitativi)
• disegno sperimentale
Calcolo della potenza
http://stat.ubc.ca/~rollin/stats/ssize/n2.html
Analisi statistica
C’è un certo numero di questioni da considerare:
• tipo di dati (variabili categoriche o continue)
• tipo di disegno di valutazione
• unità statistica dello studio
• dimensione del campione di studio
• aggiustamento per le caratteristiche dei diversi gruppi
Tipo di
disegno
Tipo di
misura del
risultato
Test
statistico
Before-and-after
Tasso
Test chi-quadrato
Pre-post con
gruppo di controllo
Tasso
Test z
Analisi statistica
Si può utilizzare un pc con un
pacchetto di programmi statistico
• Epi Info: http://www.cdc.gov/epo/epi/epiinfo.html
• PEPI: http://www.usd-inc.com/pepi.html
Alcuni esempi di analisi statistica
• Disegni before-and after (dati categorici)
– Rapporto di tassi
– Differenza di tassi
– Test chi-quadrato
• Disegni before-and-after con gruppo di
controllo (datai categorici)
– Rapporto di tassi
– Differenza di tassi
– Test z
Analisi di disegni before-and-after
con dati categorici
• Calcolo dei tassi
• Rapporto di tassi (rate ratio, RR)
– Intervallo di confidenza di RR
• Differenza tra tassi (rate difference, RD)
– Intervallo di confidenza di RD
• Test chi quadrato
– Calcolo eventi attesi
– Calcolo del chi quadrato
– Tavola del chi quadrato
Calcolo dei tassi (rate)
Prima dell’ Dopo l’
intervento intervento
N. infortuni
Ore lavorate
28
22
40 000
60 000
Tasso per 105
28 : 40 000 = 0.0007
Tasso per 10 5 = 0.0007 × 100 000 = 70
22 : 60 000 = 0.00037 Tasso per 105 = 0.00037 × 100 000 = 37
Rapporto di tassi (rate ratio, RR)
Prima dell’ Dopo l’
intervento intervento
N. infortuni
28
22
Ore lavorate
40 000
60 000
Tasso per 105
70
36.7
Rapporto di tassi (Rate Ratio, RR) = 36.7 / 70 = 0.52
Infortuni prevenuti = 1 – 0.52 = 0.48 (oppure 48%)
Intervallo di confidenza (IC) al 95% di RR
Prima dell’ Dopo l’
intervento intervento
N. infortuni
28
22
Ore lavorate
40 000
60 000
Tasso per 105
70
36.7
Trasforma RR in logaritmo: ln (0.52) = - 0.65
Varianza di ln(RR) = 1/28 + 1/22 = 0.08
Errore standard (SE) = (0.08)0.5 = 0.28
LnIC = lnRR ± z (SE) = -0.65 ± 1.96 (0.28) = -1.2 e -0.09
Trasfoma da logaritmo a numero = e-1.2 = 0.30; e- 0.09 =0.92
IC = da 0.30 a 0.92
Differenza di tassi (Rate Difference, RD)
Prima dell’ Dopo l’
intervento intervento
N. infortuni
28
22
Ore lavorate
40 000
60 000
Tasso per 105
70
36.7
Differenza di tassi = 70 – 36.7 = 33.3 per 100 000 ore lavorate
Intervallo di confidenza (IC) al 95% di RR
Prima dell’ Dopo l’
intervento intervento
N. infortuni
28
22
Ore lavorate
40 000
60 000
Tasso per 105
70
36.7
Calcola: ore lavorate/100 000; si ottiene 0.4 e 0.7
Varianza di RD = (28 / 0.4 2 + 22 / 0.6 2) = 236.11
Errore standard (SE) = (236.11) 0.5 = 15.37
IC = RD ± z (SE) = 33.3 ± 1.96 (15.37) = 3.22 e 63.45
Calcolo degli infortuni attesi (exp)
Prima dell’ Dopo l’
intervento intervento
N. infortuni
Ore lavorate
Totale
28
22
50
40 000
60 000
100 000
50 : 100 000 = exp1 : 40 000;
exp1 = (50×40 000)/100 000 = 20
50 : 100 000 = exp2 : 60 000;
exp2 = (50×60 000)/100 000 = 30
Calcolo del chi quadrato
Prima dell’ Dopo l’
intervento intervento
Totale
N. infortuni
28 (20)
22 (30)
50
Ore lavorate
40 000
60 000
100 000
(28 - 20) + (22 - 30) = 0
(28 - 20)2 + (22 - 30)2 = 32
Chi-quadrato = ((28-20)2/20) + ((22-30)2/30) = 5.33
Gradi di libertà = 1
Tavola del Chi-Quadrato
(α = probabilità errore I tipo; GdL = gradi di libertà)
α
0.995
0.99
0.975
0.95
0.90
0.10
0.05
0.025
0.01
GdL
1
---
---
0.001
0.004
0.016
2.706
3.841
5.024
6.635
2
0.010
0.020
0.051
0.103
0.211
4.605
5.991
7.378
9.210
3
0.072
0.115
0.216
0.352
0.584
6.251
7.815
9.348
11.345
4
0.207
0.297
0.484
0.711
1.064
7.779
9.488
11.143 13.277
5
0.412
0.554
0.831
1.145
1.610
9.236
11.070
12.833 15.086
Il chi-quadrato con un grado di libertà è 5.33
Livello di significatività =
Analisi di disegni before-and-after
con gruppo di controllo. Dati categorici
•
Rapporto di tassi
1.
2.
3.
4.
•
Calcolo dei tassi e di RR1 e RR2
Calcolo di D = differenza tra ln(RR1) e ln(RR2)
Calcolo di Standard Error (SD) della differenza D
Test statistico z = D/SD
Differenza di tassi
1.
2.
3.
4.
Calcolo delle differenze RD1 e RD2
Calcolo di D = differenza tra RD1 e RD2
Calcolo dello Standard Error (SD) della differenza D
Test stastico z = D/SD
1) Calcolo dei tassi e di RR1 e RR2
Pre-intervento Post-intervento
Infortuni
Controllo
Ore lavorate
Gruppo 1
Tasso x 100,000 ore
Infortuni
Intervento
Ore lavorate
Gruppo 2
Tasso x 100,000 ore
Calcola:
49
46
817000
801000
6
5.74
26
8
406000
394000
6.4
2.03
ln(RR1) = ln(5.74/6.00) = -0.043
ln(RR2) = ln(2.03/6.40) = -1.149
2) D = Differenza tra ln(RR1) e ln(RR2)
Pre-intervento Post-intervento
Controllo
(Gruppo 1)
Infortuni
49
46
Tasso
6
5.74
Intervento
(Gruppo 2)
Infortuni
26
8
Tasso
6.4
2.03
Calcola:
ln(RR1) = ln(5.74/6.00) = -0.043
ln(RR2) = ln(2.03/6.40) = -1.149
la differenza tra loro: D = ln(RR1) - ln(RR2) =
-0.043 -(-1.149) = 1.106
3) Standard Error della differenza D
Pre-intervento Post-intervento
Controllo
(Gruppo 1)
Infortuni
49
46
Tasso
6
5.74
Intervento
(Gruppo 2)
Infortuni
26
8
Tasso
6.4
2.03
Calcola:
Il reciproco dei numeri di infortunio 1/49, 1/46, 1/26, e 1/8
La somma = 0.206
La radice quadrata = 0.453.
4) Test statistico “z”
Pre-intervento Post-intervento
Controllo
(Gruppo 1)
Infortuni
49
46
Tasso
6
5.74
Intervento
(Gruppo 2)
Infortuni
26
8
Tasso
6.4
2.03
Calcola:
z = D / SE = 1.106 / 0.453 = 2.44.
Quando z > 1.96 p < 0.05
Quindi i dati mostrano che l’intervento ha funzionato.
1) Differenza tra RD1 e RD2
Infortuni
Controllo
Gruppo 1
Ore lavorate
Preintervento
49
Post-intervento
46
817000
801000
Tasso x 100,000 ore
6
5.74
Infortuni
26
8
406000
394000
6.4
2.03
Intervento
Ore lavorate
Gruppo 2
Tasso x 100,000 ore
RD1 = 6.00 - 5.74 = 0.26
RD2 = 6.40 - 2.03 = 4.37
2) D = differenza tra RD1 e RD2
Pre-intervento Post-intervento
Controllo
(Gruppo 1)
Infortuni
49
46
Tasso
6
5.74
Intervento
(Gruppo 2)
Infortuni
26
8
Tasso
6.4
2.03
RD1 = 6.00 - 5.74 = 0.26
RD2 = 6.40 - 2.03 = 4.37
Differenza fra gruppo di controllo e gruppo di intervento
D = RD2 - RD1 = 4.37 - 0.26 = 4.11
3a) Standard Error di D
Pre-intervento Post-intervento
Controllo
(Gruppo 1)
Infortuni
Intervento
(Gruppo 2)
Infortuni
Ore lavorate
Ore lavorate
49
46
817000
801000
26
8
406000
394000
Per ciascuna delle quattro categorie si calcola:
1) time units = (ore lavorate/100 000)2
2) numero infortuni / time units
3b) Standard Error di D
Pre-intervento Post-intervento
Controllo
(Gruppo 1)
Infortuni
Intervento
(Gruppo 2)
Infortuni
Ore lavorate
Ore lavorate
49
46
817000
801000
26
8
406000
394000
Numero infortuni / time units =
49/8.172 + 46/8.012 + 26/4.062 + 8/3.942
Somma = 3.54
Radice quadrata della somma = 1.8
4) Test statistico z
Pre-intervento Post-intervento
Controllo
(Gruppo 1)
Infortuni
Intervento
(Gruppo 2)
Infortuni
Ore lavorate
Ore lavorate
49
46
817000
801000
26
8
406000
394000
z = D / SE = 4.11/ 1.88 = 2.19
Se z > 1.96 allora p < 0.05
Anche questa analisi mostra che l'intervento ha funzionato
Se i valori di pre-intervento sono diversi
Esempio 1
Esempio 2
Controllo
(Gruppo 1)
Pre-intervento
12
12
Post-intervent
9
6
Intervento
(Gruppo 2)
Pre-intervento
6
6
Post-intervent
3
3
Esempio 1
differenza uguale (3) ma rapporti diversi (75% e 50%)
Esempio 2 =
rapporto uguale (50%) ma differenza diversa (6 e 3)
Se i valori di pre-intervento sono diversi
Esempio 1
Esempio 2
Controllo
(Gruppo 1)
Pre-intervento
12
12
Post-intervent
9
6
Intervento
(Gruppo 2)
Pre-intervento
6
6
Post-intervent
3
3
In tal caso i valori di z calcolati con i metodi RR e RD
possono non sono gli stessi; debbono essere calcolati
entrambi e per entrambi z dovrebbe essere più grande di
1.96 per fornire la prova che l'intervento ha funzionato.