1. La malattia è presente e il test ne rileva la presenza. Caso (il soggetto è un) vero-positivo. 2. La malattia è presente ma il test non la rileva, ovvero risulta negativo. Caso (il soggetto è un) falso-negativo. 3. Il soggetto non è ammalato ma il test indica la presenza della malattia. Caso (il soggetto è un) falso-positivo. 4. Il soggetto non è ammalato e il test non indica la presenza della malattia. Caso (Il soggetto è un) vero-negativo. Nei casi 1 e 4 il test è corretto mentre nei casi 2 e 3 si è commesso un errore. Un buon test deve avere una probabilità di errore la più piccola possibile. Precisiamo quindi le misure di questi errori, detti tassi di errore, in termini di probabilità condizionate. P N M S : : : : il il il il test dà risultato positivo test dà risultato negativo soggetto è ammalato soggetto è sano (alpha). tasso di falso-positivo (errore di tipo alpha) in soggetti sani Prob (P jS) Il numero complementare (1 ) indica la probabilità che in un soggetto sano il test dia (come dovrebbe) risultato negativo e sia chiama speci…cità del test. (beta). tasso di falso-negativo (errore di tipo beta) in soggetti malati Prob (N jM ) Il numero complementare (1 ) indica la probabilità che in un soggetto ammalato il test dia risultato negativo e sia chiama speci…cità del test. Questi numeri sono ottenuti dalle teorie biomediche correnti, e non dipendono dalla particolare distribuzione della malattia nella popolazione: pM pS percentuale di soggetti correntemente riconosciuti malati percentuale di soggetti correntemente ritenuti non a¤etti dalla malattia La probabilità che il test dia un risultato corretto per entrambi i tipi di paziente si chiama accuratezza (A : il test è accurato) e dipende dalla distribuzione della malattia nella popolazione: Prob (A) = (1 ) pS + (1 ) pM = 1 1 pS pM I test diagnostici costituiscono una diretta applicazione del teorema di Bayes; infatti un test viene fatto per “sapere”se un soggetto è o non è ammalato. Dalla conoscenza (teorica di Prob(P jS) = e Prob(N jM ) = e statisticamente approssimata di pM e pS , si perviene ad uan valutazione delle probabilità di essere sano ammalato condizionate al risultato del test Prob (M jP ) = Prob (SjP ) = Prob (M jN ) = Prob (SjN ) = (1 ) pM Prob (P jM ) pM = Prob (P jM ) pM + Prob (P jS) pS (1 ) pM + pS Prob (P jS) pS pS = Prob (P jM ) pM + Prob (P jS) pS (1 ) pM + pS e Prob (N jM ) pM = Prob (N jM ) pM + Prob (N jS) pS Prob (P jS) pS = Prob (P jM ) pM + Prob (P jS) pS pM pM + (1 ) pS (1 ) pS pM + (1 ) pS È bene osservare che queste formule - perfettamente giusti…cate - possono avere conseguenze sorprendenti. Se l’incidenza della malattia è bassa, i.e. pM è piccola, anche un test molto e¢ ciente, cioè con piccoli valori di e , dà una risposta apparentemente (ma solo apparentemente) paradossale: dopo un test positivo può essere più probabile essere sani che ammalati! Ad esempio, con = = 5% e una percentuale di malati dello 0; 1% (uno per mille); la probabilità di essere malato per un individuo scelto a caso che risulti positivo al test è minore del 2% 95 1 95 100 100 1000 = Prob (M jP ) = < = 2% 1 5 999 95 5090 5000 + 100 1000 100 1000 Questa conclusione può apparire paradossale e desta sempre una certa perplessa di¢ denza da parte dei medici nei “trucchi della matematica”. In e¤etti la situazione presentata è quella di un ipotetico “screening”casuale della popolazione su base diciamo nazionale. Nella pratica medica corrente, il medico decide di sottoporre a un test un suo paziente solo se ha un qualche sospetto che questi si trovi nelle condizioni “favorevoli” alla malattia (le cosidette popolazioni a rischio). In questo caso la probabilità a priori che il paziente sia malato, ovvero pM , è ben superiore all’incidenza della malattia su tutta la popolazione nazionale come riportata dalle statistiche. È altrettanto importante osservare che, qualsiasi sia pM , se il test risulta positivo, la probabilità a posteriori Prob(M jP ) è più grande della probabilità a priori pM (1 ) = (1 = (1 > (1 ) pM + (1 ) pS + pS ) pM + pS + [1 + ] pS ) pM + pS 2 pS