1. La malattia è presente e il test ne rileva la presenza.
Caso (il soggetto è un) vero-positivo.
2. La malattia è presente ma il test non la rileva, ovvero risulta negativo.
Caso (il soggetto è un) falso-negativo.
3. Il soggetto non è ammalato ma il test indica la presenza della malattia.
Caso (il soggetto è un) falso-positivo.
4. Il soggetto non è ammalato e il test non indica la presenza della malattia.
Caso (Il soggetto è un) vero-negativo.
Nei casi 1 e 4 il test è corretto mentre nei casi 2 e 3 si è commesso un
errore. Un buon test deve avere una probabilità di errore la più piccola possibile.
Precisiamo quindi le misure di questi errori, detti tassi di errore, in termini di
probabilità condizionate.
P
N
M
S
:
:
:
:
il
il
il
il
test dà risultato positivo
test dà risultato negativo
soggetto è ammalato
soggetto è sano
(alpha). tasso di falso-positivo (errore di tipo alpha) in soggetti sani
Prob (P jS)
Il numero complementare (1
) indica la probabilità che in un soggetto
sano il test dia (come dovrebbe) risultato negativo e sia chiama speci…cità
del test.
(beta). tasso di falso-negativo (errore di tipo beta) in soggetti malati
Prob (N jM )
Il numero complementare (1
) indica la probabilità che in un soggetto
ammalato il test dia risultato negativo e sia chiama speci…cità del test.
Questi numeri sono ottenuti dalle teorie biomediche correnti, e non dipendono dalla particolare distribuzione della malattia nella popolazione:
pM
pS
percentuale di soggetti correntemente riconosciuti malati
percentuale di soggetti correntemente ritenuti non a¤etti dalla malattia
La probabilità che il test dia un risultato corretto per entrambi i tipi di
paziente si chiama accuratezza (A : il test è accurato) e dipende dalla distribuzione della malattia nella popolazione:
Prob (A) = (1
) pS + (1
) pM = 1
1
pS
pM
I test diagnostici costituiscono una diretta applicazione del teorema di Bayes;
infatti un test viene fatto per “sapere”se un soggetto è o non è ammalato. Dalla
conoscenza (teorica di Prob(P jS) =
e Prob(N jM ) =
e statisticamente
approssimata di pM e pS , si perviene ad uan valutazione delle probabilità di
essere sano ammalato condizionate al risultato del test
Prob (M jP )
=
Prob (SjP )
=
Prob (M jN )
=
Prob (SjN )
=
(1
) pM
Prob (P jM ) pM
=
Prob (P jM ) pM + Prob (P jS) pS
(1
) pM +
pS
Prob (P jS) pS
pS
=
Prob (P jM ) pM + Prob (P jS) pS
(1
) pM +
pS
e
Prob (N jM ) pM
=
Prob (N jM ) pM + Prob (N jS) pS
Prob (P jS) pS
=
Prob (P jM ) pM + Prob (P jS) pS
pM
pM + (1
) pS
(1
) pS
pM + (1
) pS
È bene osservare che queste formule - perfettamente giusti…cate - possono
avere conseguenze sorprendenti. Se l’incidenza della malattia è bassa, i.e. pM
è piccola, anche un test molto e¢ ciente, cioè con piccoli valori di
e , dà
una risposta apparentemente (ma solo apparentemente) paradossale: dopo un
test positivo può essere più probabile essere sani che ammalati! Ad esempio,
con
= = 5% e una percentuale di malati dello 0; 1% (uno per mille); la
probabilità di essere malato per un individuo scelto a caso che risulti positivo
al test è minore del 2%
95
1
95
100
100 1000
=
Prob (M jP ) =
<
= 2%
1
5
999
95
5090
5000
+
100 1000 100 1000
Questa conclusione può apparire paradossale e desta sempre una certa perplessa
di¢ denza da parte dei medici nei “trucchi della matematica”. In e¤etti la situazione presentata è quella di un ipotetico “screening”casuale della popolazione
su base diciamo nazionale. Nella pratica medica corrente, il medico decide di
sottoporre a un test un suo paziente solo se ha un qualche sospetto che questi
si trovi nelle condizioni “favorevoli” alla malattia (le cosidette popolazioni a
rischio). In questo caso la probabilità a priori che il paziente sia malato, ovvero
pM , è ben superiore all’incidenza della malattia su tutta la popolazione nazionale
come riportata dalle statistiche.
È altrettanto importante osservare che, qualsiasi sia pM , se il test risulta
positivo, la probabilità a posteriori Prob(M jP ) è più grande della probabilità a
priori pM
(1
)
= (1
= (1
> (1
) pM + (1
) pS +
pS
) pM +
pS + [1
+ ] pS
) pM +
pS
2
pS