CENNI DI CALCOLO DELLE PROBABILITÀ (Vittorio Colagrande) Il Calcolo delle Probabilità trova molte applicazioni in Medicina, Biologia e nelle Scienze sociali. Si possono formulare in modo più appropriato le leggi di Mendel, si può stabilire il rischio di malattie, calcolare la probabilità di morte o di sopravvivenza, ecc. Concetti base: • ESPERIMENTO ALEATORIO: fenomeno del mondo reale alle cui manifestazioni possa essere associato uno stato di incertezza. Esempi: misurazione glicemia basale in una popolazione, osservazione del sesso di neonati, valutazione dell'età di un individuo, sondaggio di opinione, campionamento statistico, lancio di una moneta o di un dado. • EVENTO ALEATORIO: fatto relativo ad un esperimento aleatorio che può essere descritto da una proposizione ben definita che può risultare vera o falsa. L’evento è affetto da una incertezza in quanto l’esperimento non si è ancora compiuto o, più in generale, per mancanza o incompletezza di informazioni sui risultati dell’esperimento stesso. Esempi: “glicemia basale inferiore a 1.2 g/l”, “neonato M”, “neonato F”, “età 51 anni”, “esce 3 nel lancio di un dado”. 1 • Un evento E è certo: E=Ω se la proposizione che lo esprime è vera qualunque sia l'esito dell'esperimento; • un evento E è impossibile: E=∅ se la proposizione è falsa comunque sia l'esito dell'esperimento; • un evento E è incerto o possibile in tutti gli altri casi. Rappresentazione di eventi: Esempio 1 esperimento: misura ambulator. pressione arteriosa in adulti ≥ 18 anni evento E=“PAS < 140 e PAD < 90” 2 Esempio 2 esperimento : un lancio di due monete evento E=“esce una testa” Esempio 3 esperimento: un lancio di due dadi evento E= “somma facce = 5” Operazioni tra eventi: • Somma logica (unione) E F = è vero E o F o entrambi E =”paziente iperteso” F = “paziente diabetico” E F =”paziente iperteso o diabetico” 3 • Prodotto logico (intersezione) E ∩ F = è vero se E e F lo sono entrambi E =“glicemia a digiuno paziente diabetico” F =“glicemia<126 mg/dl“ E∩F=”glicemia<126 mg/dl in pz. diabetico” • Contrario (negazione) di un evento EC = vero se E è falso E = “malato di M” EC =”sano per M” Esempio: pazienti affetti o meno da una malattia (M = malati, S = sani) e classificati, secondo un test diagnostico T per M, come positivi (T+) o negativi (T−). Per un paziente generico si ha: M∩T+ : vero positivo (VP) M∩T− : falso negativo (FN) 4 S∩T+ : falso positivo (FP), S∩T− : vero negativo (VN). Se la risposta del test è quantitativa (es. valori pressori, valori glicemia,…) è necessario stabilire un valore soglia (cut off) che separi i risultati ritenuti positivi da quelli ritenuti negativi e si ha la situazione schematizzata in figura (dove sono positivi i valori superiori al cut off): Eventi incompatibili: se E ∩ F = ∅ Eventi necessari: se E F = Ω Eventi E1, E2, …, En incompatibili (a due a due) ed esaustivi (la loro unione è l’evento certo) sono eventi elementari dello spazio campionario Ω. 5 Misura di probabilità E’ il “grado di fiducia” attribuito ad un evento E, ovvero una misura del grado di verità che si è disposti ad attribuire ad E. Definizione soggettiva La probabilità P(E) di un evento E, secondo l’opinione di un individuo, è il prezzo che egli valuta “equo” pagare (rispettando il “principio di coerenza”) per riscuotere un importo unitario nel caso che E si verifichi. Sotto alcune condizioni, si possono ottenere la misura classica e quella frequentista di probabilità. Misura classica P(E) = numero di eventi elementari di Ω favorevoli ad E numero di eventi elementari possibili Si suppone “equiprobabili” gli eventi elementari. Esempio. Malattia dovuta ad un allele recessivo a: Supponendo gli eventi AA, Aa, aA e aa equiprobabili, P(aa) = P(“F malato”)=1/4. 6 Misura frequentista Esperimento ripetibile (con possibile risultato E) e numero “grande” di sue replicazioni “analoghe”: P(E) = numero di replicazioni con esito favorevole ad E numero totale di replicazioni analizzate Ovvero: P(E) = frequenza relativa di E sugli eventi "passati" analoghi. Esempio. Popolazione di N = 80000 abitanti di cui n = 2400 diabetici. E = “diabetico” n 2400 Frequenza relativa diabetici = f = N = 80000 = 0.03 = 3% f ≈ P(E) = probabilità di un individuo generico della popolazione di essere diabetico. Nell’ambito di tale misura si può introdurre il rapporto di prevalenza di una malattia M. Rapporto prevalenza = numero di malati ad un dato momento tot. persone a rischio nella popolaz. nel momento Esempio. Frequenza relativa diabetici (vedi sopra). 7 Requisiti di una misura di probabilità a) per ogni evento E di Ω, 0 ≤ P(E) ≤ 1, b) per l’evento certo Ω, P(Ω) = 1, c) per eventi E ed F incompatibili (E ∩ F = ∅): P(E F) = P(E) + P(F). Si prova che: • per ogni evento E: P(EC) = 1 ─ P(E) (pertanto P(∅) = 0); • per ogni coppia di eventi generici E ed F: P(E F) = P(E) + P(F) ─ P(E ∩ F) Esempio. E = “paziente iperteso”, F = “paziente diabetico” P(E) = 0.04, P(F) = 0.03, P(E ∩ F) = 0.005. E F = “paziente iperteso o diabetico” e si ha: P(E F) = P(E) + P(F) ─ P(E ∩ F) = = 0.04 + 0.03 ─ 0.005 = 0.065 = 6.5%. 8 Probabilità condizionale E ed H due eventi di Ω, si considera l’evento condizionato E|H (E "dato” H), con H ≠∅: Vero se E ∩ H vero E H = Falso se H vero e E falso . Inderminato se H falso A partire dalla: P(H ∩ E) = P(H) ⋅ P(E H) , si ottiene la probabilità condizionale: P(E H) = P(H ∩ E) . P(H) Se P(E) ≠ 0 risulta: P(H E) = P(E ∩ H) . P(E) In definitiva si ha: P(E ∩ H) = P(H) ⋅ P(E H) = P(E) ⋅ P(H E) . 9 Esempio. Fabbrica con lavoratori seguiti nel tempo, esposti o non esposti ad un fattore di rischio per una data malattia. E = “lavoratore esposto”, M = “lavoratore malato”. Fattore di rischio E EC Tot. 20 32 52 80 368 448 100 400 500 Malattia Malato (M) Sano (S) Tot. 52 P(M) = 500 = 0.10 , 100 P(E) = 500 = 0.20 , 20 P(M∩E) = 500 = 0.04 , 368 P(S∩EC) = 500 = 0.74 , 20 P(M│E) = 100 = 0.20 , 368 P(S│EC) = 400 = 0.92 , 20 P(E│M) = 52 = 0.38 , 368 P(EC│S) = 448 = 0.82 , 32 P(M│EC) = 400 = 0.08. Il rischio relativo è definito dalla: RR = P(M E) P(M EC ) Nell’esempio RR = 0.20/0.08 = 2.5: i lavoratori esposti al fattore di rischio “hanno” una probabilità (rischio) due volte e mezzo superiore di ammalarsi rispetto ai non esposti. 10 Il rischio attribuibile è dato dalla differenza: RA = P(M│E) ─ P(M│EC) e nell’esempio RA=0.20─0.08=12%: la quota di probabilità (rischio) che può essere attribuita al fattore è del 12%. Indipendenza di eventi Due eventi E ed H sono indipendenti se: P(E H) = P(E) , ovvero: P(E ∩ H) = P(H) ⋅ P(E) . Esempio. Urna con 3 palline Rosse, 2 Verdi e 1 Blu. Si estraggono 3 palline. E = “prime due Rosse e terza Verde” = R1∩R2∩V3 • le estrazioni avvengono con reimbussolamente: P(E) = P(R1)∙P(R2) ∙P(V3) = 3⋅ 3⋅ 2 = 1 6 6 6 12 e i tre eventi R1, R2 e V3 sono indipendenti; • le estrazioni avvengono senza reimbussolamente: P(E) = P(R1)∙P(R2│R1) ∙P(V3│R1∩R2) = 3⋅ 2⋅ 2 = 1 6 5 4 10 e i tre eventi R1, R2 e V3 non sono indipendenti. 11 Validità di un Test diagnostico Un gruppo di pazienti malati (M) o sani (S), classificati secondo la positività (T+) o negatività (T-) ad un test: Test T+ VP FP Pres. Malattia M S TFN VN Esempio (Ist. Radiologia Università di Genova, 1990). M=”presenza di polipi retto-colici di 7 mm o più di diametro”, T=“clisma a doppia contrasto”. Pres. Malattia M S Tot. + T 129 25 154 Test T─ 11 858 869 Tot. 140 883 1023 12 La Sensibilità del Test esprime l’attitudine del Test a riconoscere la presenza della malattia: Se = P(T+ M) = VP . VP + FN La Specificità del Test esprime l’attitudine del Test a riconoscere l’assenza della malattia: Sp = P(T− S) = VN . VN + FP L’Accuratezza del test è definita dalla: VP+ VN . Totale Per l’esempio considerato della clisma a doppio contrasto: Se = 129 = 0.92 = 92% ; 140 Sp = 858 = 0.97 = 97% ; 883 Accuratezza = 987 = 0.96 = 96% . 1023 L’“affidabilità” del clisma è maggiore nel caso si voglia verificare l’ipotesi di assenza di malattia. L’accuratezza risulta molto buona. 13 Processo diagnostico Domande: • se il test preso in esame ha dato risultato positivo, qual è la probabilità che il paziente sia effettivamente malato ? • se il test preso in esame ha dato risultato negativo, qual è la probabilità che il paziente sia effettivamente sano ? Ma come possono essere schematizzate le fasi del processo diagnostico per un paziente? • Esame anamnestico, rilevazione di sintomi e segni; ipotesi iniziale del medico (basata su esperienze precedenti, letteratura scientifica, …) associata ad un valore di probabilità di malattia; • Raccolta di altre informazioni con esami specifici (test di laboratorio, esami strumentali, ecc.) e “affinamento” della ipotesi iniziale; • Aggiornamento della probabilità iniziale sulla base delle nuove conoscenze. 14 Tale processo induttivo può essere modellizzato attraverso il Teorema di Bayes. Teorema di Bayes H1 e H2 eventi-ipotesi, H1∩H2 = ∅, H1 H2 = Ω, E = evento osservato. Esempio. H1 = M = “malattia presente”, H2 = S = “malattia assente”, E = “Test diagnostico positivo (T+)”. Il teorema permette di ricavare le probabilità a posteriori: P(H1│E) e P(H2│E). È necessario conoscere le: • probabilità a priori: P(H1) e P(H2), • verosimiglianze: P(E│H1) e P(E│H2). 15 Risulta: P(H i E ) = P(H i ) ⋅ P(E H i ) P(H 1 ) ⋅ P(E H 1 ) + P(H 2 ) ⋅ P(E H 2 ) e tale probabilità va determinata per Hi = H1 e Hi = H2. Nel caso della diagnosi medica: P(H1) = P(M) = prevalenza della malattia M, P(H2) = P(S) = 1 ─ P(M), P(E│H1) = P(T+│M) = Sensibilità Test, P(E│H2) = P(T+│S) =1─P(T-│S) =1─Specificità, P(H1│E) = P(M│T+) = Valore predittivo positivo del Test = VPP. Si ottiene: VPP = P(M T+ ) = P(M)⋅ Se P(M)⋅ Se + P(S) ⋅ (1− Sp) . 16 Se, invece, l’evento osservato è EC (nel caso della diagnosi EC = T-) la formula del teorema di Bayes si modifica sostituendo E con EC. In tal caso, per la diagnosi medica, si ha: P(EC│H1) = P(T-│M) = 1─P(T+│M) = 1─ Se, P(EC│H2) = P(T-│S) = Sp e si determina la: P(H2│EC)= P(S│T-) = Valore predittivo negativo del Test = VPN attraverso la: VPN = P(ST− ) = P(S)⋅ Sp P(S)⋅ Sp + P(M)⋅ (1− Se) . 17 Esempio. M = polipi retto-colici, Test = clisma a doppio contrasto, Si ipotizzi che la prevalenza di M sia: P(M) = 13.7%, dunque: P(S) = 1─0.137 = 86.3%. Ricordando che: Se = 129 = 0.92 = 92% , 140 Sp = 858 = 0.97 = 97% , 883 si ottiene il valore predittivo positivo: VPP = 13.7%× 92% = 84% 13.7%× 92% + 86.3%× (1- 97%) e il valore predittivo negativo: VPN = 86.3%× 97% = 99% . 86.3%× 97% + 13.7%× (1- 92%) Ne scaturisce, in questo caso, che la “forza di predizione” di un risultato negativo è maggiore di quella di un risultato positivo. 18 Esempio. Alcuni pazienti vengono sottoposti a Test per accertare se sono malati o meno di una malattia M. Il Test dà esito positivo nel 99% dei casi in cui M è presente, ma anche nel 2% dei casi in cui M è assente (S). È noto che la prevalenza di M nella popolazione di riferimento è dello 0.1%. Per un paziente con risultato positivo del Test, qual è la probabilità di essere malato ? P(M) = 0.1%, P(S) = 1─0.1% = 99.9%, P(T+│M) = 99%, P(T+│S) = 2%. La probabilità richiesta è: P(M T+ ) = 0.1%× 99% = 4.7% . 0.1%× 99% + 99.9%× 2% Si può osservare, allora, che pur in presenza di test positivo, la probabilità a posteriori di malattia resta bassa e ciò a motivo anche del piccolo valore di prevalenza di M. 19 Il teorema di Bayes ha validità anche nel caso di più eventi-ipotesi, ovvero più eventi Hi incompatibili a due a due ed esaustivi. Esempio. Un dato sintomo S in un paziente può essere stato prodotto da 3 diverse malattie M1, M2 ed M3 incompatibili ed esaustive (ovvero è noto che una ed una sola di esse è la “causa” del sintomo). Si ipotizzi che le prevalenze (probabilità a priori) siano: P(M1) = 40%, P(M2) = 50% (valore massimo), P(M3) = 10%, e le verosimiglianze: P(S│M1) = 85%, P(S│M2) = 20%, P(S│M3) = 70%. Il teorema di Bayes permette di determinare le probabilità delle malattie Mi, una volta osservato il sintomo S: P(Mi S) = P(Mi ) ⋅ P(S Mi ) P(M1) ⋅ P(S M1) + P(M 2 ) ⋅ P(S M 2 ) + P(M3) ⋅ P(S M3) . Con i dati dell’esempio si ottengono allora: P(M1│S) = 66.7%, P(M2│S) = 19.6%, P(M3│S) = 13.7%. (valore massimo) 20