CENNI DI
CALCOLO DELLE PROBABILITÀ
(Vittorio Colagrande)
Il Calcolo delle Probabilità trova molte applicazioni in
Medicina, Biologia e nelle Scienze sociali.
Si possono formulare in modo più appropriato le leggi di
Mendel, si può stabilire il rischio di malattie, calcolare la
probabilità di morte o di sopravvivenza, ecc.
Concetti base:
• ESPERIMENTO ALEATORIO: fenomeno del mondo
reale alle cui manifestazioni possa essere associato uno
stato di incertezza.
Esempi: misurazione glicemia basale in una popolazione, osservazione
del sesso di neonati, valutazione dell'età di un individuo, sondaggio di
opinione, campionamento statistico, lancio di una moneta o di un dado.
• EVENTO
ALEATORIO:
fatto
relativo
ad
un
esperimento aleatorio che può essere descritto da una
proposizione ben definita che può risultare vera o falsa.
L’evento è affetto da una incertezza in quanto l’esperimento non si è
ancora compiuto o, più in generale, per mancanza o incompletezza di
informazioni sui risultati dell’esperimento stesso.
Esempi: “glicemia basale inferiore a 1.2 g/l”, “neonato M”, “neonato
F”, “età 51 anni”, “esce 3 nel lancio di un dado”.
1
• Un evento E è certo: E=Ω se la proposizione che lo
esprime è vera qualunque sia l'esito dell'esperimento;
• un evento E è impossibile: E=∅ se la proposizione è falsa
comunque sia l'esito dell'esperimento;
• un evento E è incerto o possibile in tutti gli altri casi.
Rappresentazione di eventi:
Esempio 1
esperimento: misura ambulator.
pressione arteriosa
in adulti ≥ 18 anni
evento E=“PAS < 140 e
PAD < 90”
2
Esempio 2
esperimento : un lancio di
due monete
evento E=“esce una testa”
Esempio 3
esperimento: un lancio
di due dadi
evento E= “somma
facce = 5”
Operazioni tra eventi:
• Somma logica (unione)
E  F = è vero E o F o entrambi
E =”paziente iperteso”
F = “paziente diabetico”
E  F =”paziente iperteso
o diabetico”
3
• Prodotto logico (intersezione)
E ∩ F = è vero se E e F lo sono entrambi
E =“glicemia a digiuno
paziente diabetico”
F =“glicemia<126 mg/dl“
E∩F=”glicemia<126 mg/dl
in pz. diabetico”
• Contrario (negazione) di un evento
EC = vero se E è falso
E = “malato di M”
EC =”sano per M”
Esempio: pazienti affetti o meno da una malattia
(M = malati, S = sani) e classificati, secondo un
test diagnostico T per M, come positivi (T+) o
negativi (T−). Per un paziente generico si ha:
M∩T+ : vero positivo (VP)
M∩T− : falso negativo (FN)
4
S∩T+ : falso positivo (FP),
S∩T− : vero negativo (VN).
Se la risposta del test è quantitativa (es. valori
pressori, valori glicemia,…) è necessario stabilire
un valore soglia (cut off) che separi i risultati
ritenuti positivi da quelli ritenuti negativi e si ha
la situazione schematizzata in figura (dove sono
positivi i valori superiori al cut off):
Eventi incompatibili: se E ∩ F = ∅
Eventi necessari: se E  F = Ω
Eventi E1, E2, …, En incompatibili (a due a due) ed esaustivi
(la loro unione è l’evento certo) sono eventi elementari
dello spazio campionario Ω.
5
Misura di probabilità
E’ il “grado di fiducia” attribuito ad un evento E,
ovvero una misura del grado di verità che si è
disposti ad attribuire ad E.
Definizione soggettiva
La probabilità P(E) di un evento E, secondo
l’opinione di un individuo, è il prezzo che egli
valuta “equo” pagare (rispettando il “principio
di coerenza”) per riscuotere un importo unitario
nel caso che E si verifichi.
Sotto alcune condizioni, si possono ottenere la misura
classica e quella frequentista di probabilità.
Misura classica
P(E) = numero di eventi elementari di Ω favorevoli ad E
numero di eventi elementari possibili
Si suppone “equiprobabili” gli eventi elementari.
Esempio. Malattia dovuta ad un allele recessivo a:
Supponendo gli eventi AA,
Aa, aA e aa equiprobabili,
P(aa) = P(“F malato”)=1/4.
6
Misura frequentista
Esperimento ripetibile (con possibile risultato E) e
numero “grande” di sue replicazioni “analoghe”:
P(E) = numero di replicazioni con esito favorevole ad E
numero totale di replicazioni analizzate
Ovvero:
P(E) = frequenza relativa di E sugli eventi "passati"
analoghi.
Esempio. Popolazione di N = 80000 abitanti di cui
n = 2400 diabetici.
E = “diabetico”
n 2400
Frequenza relativa diabetici = f = N = 80000 = 0.03 = 3%
f ≈ P(E) = probabilità di un individuo generico della
popolazione di essere diabetico.
Nell’ambito di tale misura si può introdurre il rapporto di
prevalenza di una malattia M.
Rapporto prevalenza =
numero di malati ad un dato momento
tot. persone a rischio nella popolaz. nel momento
Esempio. Frequenza relativa diabetici (vedi sopra).
7
Requisiti di una misura di probabilità
a) per ogni evento E di Ω,
0 ≤ P(E) ≤ 1,
b) per l’evento certo Ω,
P(Ω) = 1,
c) per eventi E ed F incompatibili (E ∩ F = ∅):
P(E  F) = P(E) + P(F).
Si prova che:
• per ogni evento E: P(EC) = 1 ─ P(E)
(pertanto P(∅) = 0);
• per ogni coppia di eventi generici E ed F:
P(E  F) = P(E) + P(F) ─ P(E ∩ F)
Esempio.
E = “paziente iperteso”, F = “paziente diabetico”
P(E) = 0.04, P(F) = 0.03, P(E ∩ F) = 0.005.
E  F = “paziente iperteso o diabetico” e si ha:
P(E  F) = P(E) + P(F) ─ P(E ∩ F) =
= 0.04 + 0.03 ─ 0.005 = 0.065 = 6.5%.
8
Probabilità condizionale
E ed H due eventi di Ω, si considera l’evento
condizionato E|H (E "dato” H), con H ≠∅:
Vero
se E ∩ H vero
E H = Falso
se H vero e E falso .
Inderminato
se H falso








A partire dalla:
P(H ∩ E) = P(H) ⋅ P(E H) ,
si ottiene la probabilità condizionale:
P(E H) = P(H ∩ E) .
P(H)
Se P(E) ≠ 0 risulta:
P(H E) = P(E ∩ H) .
P(E)
In definitiva si ha:
P(E ∩ H) = P(H) ⋅ P(E H) = P(E) ⋅ P(H E) .
9
Esempio. Fabbrica con lavoratori seguiti nel tempo, esposti
o non esposti ad un fattore di rischio per una
data malattia.
E = “lavoratore esposto”, M = “lavoratore malato”.
Fattore di rischio
E
EC
Tot.
20
32
52
80
368
448
100
400
500
Malattia
Malato (M)
Sano (S)
Tot.
52
P(M) = 500 = 0.10 ,
100
P(E) = 500 = 0.20 ,
20
P(M∩E) = 500 = 0.04 ,
368
P(S∩EC) = 500 = 0.74 ,
20
P(M│E) = 100 = 0.20 ,
368
P(S│EC) = 400 = 0.92 ,
20
P(E│M) = 52 = 0.38 ,
368
P(EC│S) = 448 = 0.82 ,
32
P(M│EC) = 400 = 0.08.
Il rischio relativo è definito dalla:
RR =
P(M E)
P(M EC )
Nell’esempio RR = 0.20/0.08 = 2.5: i lavoratori esposti al
fattore di rischio “hanno” una probabilità (rischio) due volte
e mezzo superiore di ammalarsi rispetto ai non esposti.
10
Il rischio attribuibile è dato dalla differenza:
RA = P(M│E) ─ P(M│EC)
e nell’esempio RA=0.20─0.08=12%: la quota di probabilità
(rischio) che può essere attribuita al fattore è del 12%.
Indipendenza di eventi
Due eventi E ed H sono indipendenti se:
P(E H) = P(E) , ovvero: P(E ∩ H) = P(H) ⋅ P(E) .
Esempio. Urna con 3 palline Rosse, 2 Verdi
e 1 Blu.
Si estraggono 3 palline.
E = “prime due Rosse e terza Verde” = R1∩R2∩V3
• le estrazioni avvengono con reimbussolamente:
P(E) = P(R1)∙P(R2) ∙P(V3) =
3⋅ 3⋅ 2 = 1
6 6 6 12
e i tre eventi R1, R2 e V3 sono indipendenti;
• le estrazioni avvengono senza reimbussolamente:
P(E) = P(R1)∙P(R2│R1) ∙P(V3│R1∩R2) =
3⋅ 2⋅ 2 = 1
6 5 4 10
e i tre eventi R1, R2 e V3 non sono indipendenti.
11
Validità di un Test diagnostico
Un gruppo di pazienti malati (M) o sani (S),
classificati secondo la positività (T+) o negatività
(T-) ad un test:
Test
T+
VP
FP
Pres. Malattia
M
S
TFN
VN
Esempio (Ist. Radiologia Università di Genova, 1990).
M=”presenza di polipi retto-colici di 7 mm o più di
diametro”,
T=“clisma a doppia contrasto”.
Pres. Malattia
M
S
Tot.
+
T
129
25
154
Test
T─
11
858
869
Tot.
140
883
1023
12
La Sensibilità del Test esprime l’attitudine del
Test a riconoscere la presenza della malattia:
Se = P(T+ M) =
VP .
VP + FN
La Specificità del Test esprime l’attitudine del
Test a riconoscere l’assenza della malattia:
Sp = P(T− S) =
VN .
VN + FP
L’Accuratezza del test è definita dalla:
VP+ VN .
Totale
Per l’esempio considerato della clisma a doppio contrasto:
Se = 129 = 0.92 = 92% ;
140
Sp = 858 = 0.97 = 97% ;
883
Accuratezza = 987 = 0.96 = 96% .
1023
L’“affidabilità” del clisma è maggiore nel caso si voglia
verificare l’ipotesi di assenza di malattia. L’accuratezza
risulta molto buona.
13
Processo diagnostico
Domande:
• se il test preso in esame ha dato risultato
positivo, qual è la probabilità che il paziente sia
effettivamente malato ?
• se il test preso in esame ha dato risultato
negativo, qual è la probabilità che il paziente sia
effettivamente sano ?
Ma come possono essere schematizzate le fasi del
processo diagnostico per un paziente?
• Esame anamnestico, rilevazione di sintomi e segni;
ipotesi iniziale del medico (basata su esperienze
precedenti, letteratura scientifica, …) associata ad
un valore di probabilità di malattia;
• Raccolta di altre informazioni con esami specifici
(test di laboratorio, esami strumentali, ecc.) e
“affinamento” della ipotesi iniziale;
• Aggiornamento della probabilità iniziale sulla base
delle nuove conoscenze.
14
Tale processo induttivo può essere modellizzato
attraverso il Teorema di Bayes.
Teorema di Bayes
H1 e H2 eventi-ipotesi,
H1∩H2 = ∅, H1  H2 = Ω,
E = evento osservato.
Esempio.
H1 = M = “malattia presente”, H2 = S = “malattia assente”,
E = “Test diagnostico positivo (T+)”.
Il teorema permette di ricavare le probabilità a
posteriori:
P(H1│E) e P(H2│E).
È necessario conoscere le:
• probabilità a priori: P(H1) e P(H2),
• verosimiglianze: P(E│H1) e P(E│H2).
15
Risulta:
P(H i E ) =
P(H i ) ⋅ P(E H i )
P(H 1 ) ⋅ P(E H 1 ) + P(H 2 ) ⋅ P(E H 2 )
e tale probabilità va determinata per Hi = H1 e Hi = H2.
Nel caso della diagnosi medica:
P(H1) = P(M) = prevalenza della malattia M,
P(H2) = P(S) = 1 ─ P(M),
P(E│H1) = P(T+│M) = Sensibilità Test,
P(E│H2) = P(T+│S) =1─P(T-│S) =1─Specificità,
P(H1│E) = P(M│T+) = Valore predittivo positivo
del Test = VPP.
Si ottiene:
VPP = P(M T+ ) =
P(M)⋅ Se
P(M)⋅ Se + P(S) ⋅ (1− Sp) .
16
Se, invece, l’evento osservato è EC (nel caso della
diagnosi EC = T-) la formula del teorema di Bayes
si modifica sostituendo E con EC.
In tal caso, per la diagnosi medica, si ha:
P(EC│H1) = P(T-│M) = 1─P(T+│M) = 1─ Se,
P(EC│H2) = P(T-│S) = Sp
e si determina la:
P(H2│EC)= P(S│T-) = Valore predittivo negativo
del Test = VPN
attraverso la:
VPN = P(ST− ) =
P(S)⋅ Sp
P(S)⋅ Sp + P(M)⋅ (1− Se) .
17
Esempio.
M = polipi retto-colici,
Test = clisma a doppio contrasto,
Si ipotizzi che la prevalenza di M sia:
P(M) = 13.7%, dunque: P(S) = 1─0.137 = 86.3%.
Ricordando che:
Se = 129 = 0.92 = 92% ,
140
Sp = 858 = 0.97 = 97% ,
883
si ottiene il valore predittivo positivo:
VPP =
13.7%× 92%
= 84%
13.7%× 92% + 86.3%× (1- 97%)
e il valore predittivo negativo:
VPN =
86.3%× 97%
= 99% .
86.3%× 97% + 13.7%× (1- 92%)
Ne scaturisce, in questo caso, che la “forza di predizione”
di un risultato negativo è maggiore di quella di un risultato
positivo.
18
Esempio.
Alcuni pazienti vengono sottoposti a Test per accertare se
sono malati o meno di una malattia M.
Il Test dà esito positivo nel 99% dei casi in cui M è
presente, ma anche nel 2% dei casi in cui M è assente (S).
È noto che la prevalenza di M nella popolazione di
riferimento è dello 0.1%.
Per un paziente con risultato positivo del Test, qual è la
probabilità di essere malato ?
P(M) = 0.1%,
P(S) = 1─0.1% = 99.9%,
P(T+│M) = 99%,
P(T+│S) = 2%.
La probabilità richiesta è:
P(M T+ ) =
0.1%× 99%
= 4.7% .
0.1%× 99% + 99.9%× 2%
Si può osservare, allora, che pur in presenza di test positivo,
la probabilità a posteriori di malattia resta bassa e ciò a
motivo anche del piccolo valore di prevalenza di M.
19
Il teorema di Bayes ha validità anche nel caso di più
eventi-ipotesi, ovvero più eventi Hi incompatibili a
due a due ed esaustivi.
Esempio.
Un dato sintomo S in un paziente può essere stato prodotto
da 3 diverse malattie M1, M2 ed M3 incompatibili ed
esaustive (ovvero è noto che una ed una sola di esse è la
“causa” del sintomo).
Si ipotizzi che le prevalenze
(probabilità a priori) siano:
P(M1) = 40%,
P(M2) = 50% (valore massimo),
P(M3) = 10%,
e le verosimiglianze:
P(S│M1) = 85%,
P(S│M2) = 20%,
P(S│M3) = 70%.
Il teorema di Bayes permette di determinare le probabilità
delle malattie Mi, una volta osservato il sintomo S:
P(Mi S) =
P(Mi ) ⋅ P(S Mi )
P(M1) ⋅ P(S M1) + P(M 2 ) ⋅ P(S M 2 ) + P(M3) ⋅ P(S M3) .
Con i dati dell’esempio si ottengono allora:
P(M1│S) = 66.7%, P(M2│S) = 19.6%, P(M3│S) = 13.7%.
(valore massimo)
20