IL TEOREMA DI BAYES Italo Nofroni Statistica medica - Facoltà di Medicina Sapienza - Roma Questo processo logico è particolarmente frequente in ambito sanitario ove il clinico si trova ad osservare segni e sintomi, nonché risultati delle analisi di laboratorio, e tenta di risalire alla causa che li ha determinati Ovvero cerca di stabilire se il soggetto sia sano o malato e, eventualmente, da quale patologia sia affetto Una formalizzazione matematica è però possibile e, sotto certe condizioni, agevolmente applicabile In particolare, tale procedura è in grado di fornire un notevole supporto al medico per quanto riguarda la definizione di una diagnosi Generalmente nel Calcolo delle probabilità si parte da una prova e ci si chiede la probabilità che si verifichi uno dei possibili eventi dello spazio degli eventi In altri casi si procede con una logica opposta: si osserva un evento e ci si chiede da quale delle possibili cause (prove) è più probabile che possa essere stato determinato Abitualmente il medico svolge questo processo diagnostico a livello inconscio, basandosi sulle informazioni acquisite dai suoi studi, dalla consultazione della letteratura, dalla sua esperienza e dal suo intuito In ogni caso, in genere, non formalizza tale processo logico in una procedura matematica Tale procedura viene detta Teorema di Bayes, dal nome del MONACO scozzese x y Bayes (ccc – mmm) che l’ha formalizzata nel lontano 177y 1 Siano: Possiamo perciò indicare P(Ci) = probabilità a priori (prevalenza) Ci le possibili “cause” P(E/Ci) = probabilità probative, ovvero che una causa determini un effetto noto E un determinato “effetto” P(Ci/E) = probabilità a posteriore, ovvero che, osservato l’effetto, si voglia risalire alla causa che lo ha determinato Avremo quindi la formula P( C1 / E ) = P( C 1 )P( E / C 1 ) Esempio 1 In un ipotetico reparto di Medicina interna si ricoverano pazienti affetti solo da 4 possibili patologie K ∑ P( Ci )P( E / Ci ) i =1 Blocco intestinale Gastroenterite Appendicite Ulcera gastrica Sulla base dell’esperienza pregressa, possiamo definire le probabiliità a priori di tali patologie (prevalenza) Definiamo quindi le probabilità probative ovvero che ciascuna patologia sviluppi il sintomo dolore addominale P (BI) = 0.05 P (GE) = 0.50 P (DA/BI) = 0.95 P (Ap) = 0.35 P (DA/GE) = 0.20 P (UG) = 0.10 P (DA/Ap) = 0.70 ----------------- P (DA/UG) = 0.10 Totale = 1 2 Possiamo scrivere Si presenta un paziente con dolori addominali Ci domandiamo con quale probabilità risulti affetto da appendicite (o altra patologia) P ( Ap / DA) = P ( Ap ) P ( DA / Ap ) K ∑ P ( Patoli ) P ( DA / Patoli ) i =1 Da cui Parimenti abbiamo P( Ap / DA ) = 0.35 x0.70 0.35 x0.7 + 0.05 x0.95 + 0.5 x0.2 + 0.1 x0.1 P( Ap / DA ) = P(BI/DA) = 0.118 0.245 P(GE/DA) = 0.248 0.245 + 0.0475 + 0.1 + 0.01 P(UG/DA) = 0.025 P( Ap / DA ) = 0.245 = 0.6097 0.4025 Si può verificare che P(BI/DA) = 0.118 P(GE/DA) = 0.248 P(UG/DA) = 0.025 P(AP/DA) = 0.610 totale = 1.00 (circa) 3