PROBABILITA’ E TEST
DIAGNOSTICI
IL TEST E’
POSITIVO..
In tutti quei casi in cui le manifestazioni di un fenomeno
(EVENTI) non possono essere determinate a priori in
modo univoco, e i risultati possono essere oggetto di
discussione e di valutazioni diverse, la “Probabilità” è
strumento “fondamentale”.
La “Probabilità” consiste in una valutazione numerica
associata alla previsione del un risultato di un
esperimento o di una prova, che può dar luogo a
diversi risultati (Esperimento Aleatorio)
L’EVENTO E’ L’ELEMENTO DI BASE AL
QUALE PUO’ ESSERE APPLICATA UNA
PROBABILITA’, ESSO E’ IL
RISULTATO DI UN’OSSERVAZIONE
O DI UN ESPERIMENTO
SPAZIO DEGLI EVENTI (S): l’insieme di tutti
i possibili esiti di un esperimento (serie di prove
con esiti non prevedibili)
EVENTO (E, F, A..) : è un qualsiasi sottoinsieme (collezione di possibili
esiti) dello spazio S.
Si dice che un evento si verifica se l’esito dell’esperimento è incluso nella
definizione data di evento
E
Evento certo (S) = (E) + (Ē)
Lo spazio degli eventi (S) è composto da tutti
i possibili esiti di un esperimento:
-
Eventi semplici
Eventi composti (combinazioni di eventi
semplici)
Evento Certo (S)
Evento impossibile (Ø)
ES: Risultati possibili nel duplice lancio di una moneta
S = {(testa, testa), (testa, croce), (croce, testa), (croce,
croce)}
E (evento semplice) = {(testa, croce)}
E (evento composto) = 1 testa =
{(testa, croce), (croce, testa)}
Ē = (evento complementare di E) ={(testa, testa), (croce,
croce)}
Lancio di un dado:
S:
S
1
4
2
5
3
6
Eventi Semplici (A, B, C, D,
E, F) : esce 1, esce 2, esce
3, esce 4, esce 5, esce 6
Eventi composti (X, Y): esce
un numero pari, esce un
numero dispari….
Evento certo: esce un
numero da 1 a 6
Evento impossibile: esce 7
POSSIBILI OPERAZIONI SU EVENTI
 L’unione di due eventi A e B (A  B), definita come
l’insieme degli esiti che appartengono o all’evento A o
all’evento B o simultaneamente ad A e B.
L’intersezione di due eventi A e B (AB), definita
dall’insieme degli esiti che verificano
contemporaneamente A e l’evento B
Il complemento di un evento E, indicato con “Ē ” che
rappresenta l’evento “non E”, ed è dato da S-E
LO STRUMENTO GRAFICO
UTILIZZATO PER RAPPRESENTARE
RELAZIONI SEMPLICI E
COMPLESSE TRA PIU’ EVENTI E’
IL DIAGRAMMA DI VENN
DIAGRAMMA DI VENN
S
S
Unione
Intersezione
A
A
B
B
S
A
B
In questo caso i 2 eventi si dicono
MUTUALMENTE ESCLUSIVI ovvero
non possono accadere simultaneamente,
gli eventi non hanno esiti in comune
INTERSEZIONE = INSIEME VUOTO
ESERCIZIO
Disegnate 3 insiemi tra loro parzialmente sovrapposti (diagramma di
Venn) che rappresentino graficamente le seguenti 3 popolazioni: i
maschi, coloro che fumano, coloro che hanno un’età compresa tra
i 15 e i 20 anni
Si definiscano graficamente le seguenti popolazioni:
- le femmine fumatrici
- coloro che fumano ed hanno tra i 15 e 20 anni
M
Fum
15/20
La probabilità P(.) è una misura che
associa ad ogni evento “E” un valore
numerico “P(E)” che esprime l’incertezza
relativa al verificarsi dell’evento
P(s)
s
P(.)
DEFINIZIONI DI PROBABILITA’
Definizioni Classica
 Definizione Frequentista
 Definizione Soggettivista

Definizione Classica
Se un esperimento può dar luogo ad n esiti tutti
egualmente possibili, e se m di questi esiti hanno
l’attributo A, si definisce come probabilità
dell’evento A la seguente espressione:
P(A) = m/n =casi favorevoli / casi possibili
Esempio: Supponiamo di avere un urna con 25 palline
colorate, 10 bianche, 7 verdi e 8 rosse:
La probabilità di estrarre una pallina bianca sarà
10/25
- L’approccio Classico, o matematico, è il primo che si è affermato,
in quanto particolarmente appropriato ai giochi d’azzardo
Al di fuori del campo di applicazione dei giochi d’azzardo è
difficile trovare situazioni in cui tutti gli esiti di un esperimento
casuale possano considerarsi equamente probabili
Per esempio, cosa dire dell’esito della somministrazione di un
farmaco ad un paziente?
Nulla può, a priori, giustificare l’attribuzione ai due possibili esiti
dell’esperimento (guarire/non guarire) di un’uguale probabilità.
In tali situazioni è possibile associare un valore di probabilità solo
provando e riprovando l’esperimento in
condizioni costanti.
Definizione Frequentista
Se un esperimento è ripetuto n volte in
condizioni sostanzialmente identiche, e se A,
un suo possibile evento, si verifica m volte,
all’aumentare di n, il rapporto m/n si avvicina
ad un limite fisso che è la probabilità di A
P(A) =lim (m/n)
n→∞
!!Si può così ricavare un valore di probabilità
come limite cui tende la proporzione di volte
in cui l’evento si realizza
Se un esperimento viene ripetuto molte volte la
probabilità di un evento, stimata tramite la
frequenza relativa, tende ad avvicinarsi alla vera
probabilità di quell’evento.
In pratica una stima della probabilità basata su
poche ripetizioni è INACCURATA, ma via via che
il numero di tentativi cresce la stima della
probabilità diventa sempre più precisa
Definizione soggettivista
Nella realtà scientifica sono inclusi fenomeni che non possono essere
ricondotti a condizioni di ripetibilità e equiprobabilità , perché
considerati eventi unici o irripetibili.
Per questi fenomeni, sia l’approccio classico che quello frequentista
falliscono.
Per rispondere a domande del tipo: qual è la probabilità che ...
- ... avvenga una catastrofe
- ... una specie animale o vegetale si estingua
Si deve ricorrere alla definizione Soggettivista di probabilità:
Sia dato un esperimento e sia C un suo possibile esito, la probabilità
dell’evento C è un valore che esprime quanto un individuo “crede” nel
fatto che l’evento C si verifichi.
P(E)= grado di fiducia accordato al verificarsi
dell’evento stesso
PROPRIETA’ DELLA PROBABILITA’ DI UN
EVENTO
1.
2.
3.
4.
La probabilità di un evento è un numero compreso
tra 0 e 1
0  Pr(E)  1
La probabilità di un evento certo è 1P(S) = 1
La probabilità di un evento impossibile (o di un
insieme vuoto) è “0”
La probabilità dell’evento complementare (Ē) di E
è data dalla differenza tra la probabilità di tutto
lo spazio campionario (1) meno quella dell’evento
P(Ē)=1-P(E)
PROBABILITA’ DELL’UNIONE DI EVENTI:
REGOLA DELLA SOMMA
P(EF) = P(E)+P(F)-P(EF)
P(EF) = P(E)+P(F) per eventi disgiunti
E
F
intersezione
ESEMPIO
LANCIO DI 1 DADO
S=[1,2,3,4,5,6]
A=[ESCE UN NUMERO PARI]
B=[ESCE 2,3,5]
P(AB)=?
ESEMPIO
Consideriamo 2 gruppi sanguigni a cui una persona può
appartenere: 0, B
Ipotizzando di conoscere le due probabilità
P(gruppo 0)=0.46
P(gruppo B)=0.08
Ci chiediamo qual è la probabilità che un individuo
appartenga ad uno dei due gruppi
i due eventi sono incompatibili  DISGIUNTI
P(gruppo 0  gruppo B) = 0.46+0.08=0.54
ESEMPIO
Supponiamo di avere i seguenti dati
Titolo studio genitore
Elementar medie
i
Titolo
studio
figlio
diploma
Elementar .04
i
.01
0.0
.05
Medie
.06
.24
.05
.35
Diploma
.05
.30
.25
.60
.15
.55
.30
1
P(gd o Fd)=0.3 + 0.60 - 0.25 = 0.65
P(gd o fe) = 0.3 + 0.05 =0.35
LA PROBABILITA’ DI UN EVENTO
CONDIZIONATA AD UN ALTRO EVENTO
LA PROBABILITA’ CONDIZIONATA E’ LA MISURA CHE
ESPRIME LA FIDUCIA CHE UN EVENTO SI VERIFICHI DATO
CHE UN ALTRO SI E’ GIA’ VERIFICATO.
Dati due eventi A e B, se P(B)>0, allora la probabilità che A si
verifichi dato B, è chiamata Probabilità Condizionata e si indica
con:
P(A|B)
P(A dato B)
IL FATTO CHE L’EVENTO B SI SIA GIA’ VERIFICATO
FA RESTRINGERE LO SPAZIO DEI POSSIBILI ESITI
PER A, TALE SOTTOINSIEME E’ DEFINITO IN MODO
DA CONTENERE TUTTI E SOLTANTO GLI EVENTI CHE
RAPPRESENTANO IL VERIFICARSI DELL’EVENTO
CONDIZIONANTE
ESEMPIO
Supponiamo di avere i seguenti dati
Titolo studio genitore
Elementar medie
i
Titolo
studio
figlio
diploma
Elementar .04
i
.01
0.0
.05
Medie
.06
.24
.05
.35
Diploma
.05
.30
.25
.60
.15
.55
.30
1
P(Fd|Ge) = 0.05/0.15 = 0.33
P(Fd|Gm) = 0.30/0.55 = 0.54
ESEMPIO
SI CONSIDERI L’ESTRAZIONE SENZA
REIMMISSIONE DI DUE CARTE DAL MAZZO
A = LA PRIMA CARTA E’ PICCHE
B|A = LA SECONDA CARTA E’ PICCHE
P(A) = 13/52
P(B|A) = 12/51
PROBABILITA’ DELL’INTERSEZIONE TRA
EVENTI: REGOLA DEL PRODOTTO
Dati due eventi A e B,
P(A  B) = P(A|B)P(B) = P(B|A)P(A)
P(A|B)=P(A  B) /P(B)
dove P(A|B) è la probabilità condizionata di A dato B e
con P(A  B) si indica la probabilità congiunta degli
eventi A e B
INDIPENDENZA TRA EVENTI
Se due eventi A e B sono indipendenti allora
l’avverarsi di 1 non incide sull’avverarsi di
un altro
La probabilità condizionata di A dato B
diventa
P(A|B) = P(A)
La probabilità dell’intersezione diventa
P(A  B) = P(A|B)P(B) = P(A)P(B)
Si lancia una coppia di dadi la somma dei
risultati è 6, qual è la probabilità che uno
dei due dadi segni 2?
A= SOMMA E’ 6 (si è già verificato)
B= UN DADO SEGNA 2
P(B|A) = P(B ∩ A)/P(A)= (2/36)/(5/36) =
2/5
Popolazione: 750 individui
100 maschi e 150 femmine con schizofrenia (MSi e FSj)
200 maschi e 300 femmine con depressione (MDi e FDj)
Consideriamo i tre eventi così definiti
B1={Estrarre una persona con schizzofrenia}
Pr(B1)= [250/750]
C1={Estrarre una maschio} Pr(C1)= [300/750]
QUAL’E’ LA PROBABILITA’ DI ESTRARRE UN MASCHIO
CON SCHIZZOFRENIA?
Pr(B1 ∩ C1 ) = ?
LA PROBABILITA’ CONDIZIONATA E’
Pr(C1 |B1) = Pr(C1 ∩ B1) / Pr(B1) = (100/750)/(250/750) =
100/250 = 0.4
PER LA REGOLA DEL PRODOTTO
Pr(C1 ∩ B1) = Pr(C1 |B1) Pr(B1) = (100/250)(250/750) =
100/750 = 0.133
INDIPENDENZA
Pr(C1 ) = (100+200)/750 =300/750 = 100/250 =
0.4 = Pr(C1 |B1)
C1 E B1 SONO INDIPENDENTI
Infatti
Pr(C1 )Pr(B1 ) = (300/750)*(250/750) =
100/750 =0.133 = Pr(C1 ∩ B1)
GLI ESAMI DIAGNOSTICI SERVONO PER DETERMINARE
L’EVENTUALE PRESENZA/ASSENZA DI UNA MALATTIA IN
UN DETERMINATO SOGGETTO
Questi esami hanno come obiettivo il discriminare i soggetti malati
da quelli sani, relativamente alla condizione esaminata
TEST DIAGNOSTICI
- amniocentesi
- duo/triplo test
- Ecografie, TAC
PROGRAMMI DI SCREENING
- neoplasia della mammella
- neoplasia della cervice uterina
- insufficienza tiroidea (neonati)
VALUTAZIONE DELLA PERFORMANCE DI UN TEST
DIAGNOSTICO
Non esistono test diagnostici che forniscono risultati certi ed affidabili
in tutte le situazioni e nel 100% dei casi.
L'esito deve essere visto come una indicazione di «probabilità».
La probabilità di ottenere risultati «veri» (cioè aderenti alla realtà) è
soprattutto legata al tipo di test, non tutti i test raggiungano la stessa
probabilità, è possibile invece stilare una sorta di “classifica” della
performance dei vari test.
Nella situazione più semplice un esame diagnostico fornisce un risultato
che può essere espresso come: “esame positivo”/”esame negativo”.
Anche gli esami il cui il risultato è espresso su scala continua sono
interpretati come Positivi e negativi, identificando dei valori soglia
SCHEMA PER LA VALUTAZIONE DELLA PERFORMANCE
DI UN TEST DIAGNOSTICO
A
A
A
i
soggetti
A
A
In base ai risultai del Golden Test si riempiono
le 4 celle della TABELLA DI CONTINGENZA
ESITO GOLDEN TEST
RIULTATI GOLDEN TEST
V.P
F.N.
F.P.
V.N
La PERFORMANCE di un test dipende dalla quota di
risultati falsi-positivi e falsi-negativi generati
applicando il test ad una popolazione nella quale la
malattia è presente (diagnosticata con il test gold
standard).
SENSIBILITA’ E SPECIFICITA’
La SENSIBILITA’ e la SPECIFICITA’ sono le due
misure principali che vengono impiegate per valutare
la capacità del test di individuare, fra gli individui di
una popolazione, quelli provvisti del «carattere»
ricercato e quelli che invece ne sono privi.
In pratica, per i nostri scopi, il «carattere» è
rappresentato quasi sempre dalla malattia o
dall'infezione.
La sensibilità indica la capacità del test di identificare
correttamente gli individui ammalati.
In termini di probabilità, la sensibilità è la probabilità
che un soggetto ammalato risulti positivo al test; si
può anche dire che essa è la proporzione di soggetti
ammalati che risultano positivi al test.
SENSIBILITA’:
P(T+|M+) =1- P(T-|M+)
i
soggetti
Ad un esame superficiale, potrebbe sembrare che la
sensibilità sia l'unica qualità desiderabile in un test:
infatti, sembrerebbe un eccellente risultato il poter
identificare correttamente tutti i soggetti con la
malattia impiegando un test con una sensibilità del
100%.
Tuttavia, esaminando meglio la questione, si giunge alla
conclusione che la suddetta qualità non è sufficiente.
Infatti, è necessario anche un altro requisito: il test deve
identificare come positivi soltanto i soggetti che hanno
la malattia; cioè, è necessario che fra i positivi al test
non siano inclusi anche degli individui sani.
La specificità è la capacità del test di identificare
correttamente i soggetti sani.
In termini di probabilità, la specificità è la
probabilità che un individuo sano risulti negativo al
test; si può anche dire che essa è la proporzione
di sani che risultano negativi al test.
SPECIFICITA’:
P(T-|M-) = 1- P(T+|M-)
i
soggetti
FALSI POSITIVI E FALSI NEGATVI
Falso negativo: esito negativo del test su un individuo
malato
P(falso negativo) = P(T-|M+) =1- Sens
Falso positivo: esito positivo del test su un individuo
sano
P(falso positivo) = P(T+|M-) = 1- Spec
Esempio sul calcolo della sensibilità e specificità
Test basato sulla fosfocreatinchinasi per l’infarto miocardico
Casi
Non
casi
T +
215
16
231
T -
15
114
129
230
130
360
Sensibilità = P(T+|M+)=215/230=0.93
Specificità =P(T-|M-)=114/130=0.88
P(falso positivo) =P(T+|M-)=1-specificità=16/130=0.12
P(falso negativo) =P(T-|M+)=1-sensibilità=15/230=0.07
Frequenza di malattia nel campione = Prevalenza = P(M+)=230/360=0.64
MASSIMIZZAZIONE DI SENSIBILITA’ E
SPECIFICITA’: L’INFLUENZA DEL VALORE SOGLIA
Finora abbiamo illustrato le caratteristiche di un ipotetico
test presumendo che esso fornisse risultati del tipo
positivo/negativo oppure sano/malato oppure si/no.
In altri casi, però, i test forniscono risultati classificabili
in più di due categorie oppure su scala continua.
In questo ultimo caso i risultati del test devono essere
comunque “ dicotomizzati ” e la scelta della soglia che
identifica il passaggio da POSITIVO A NEGATIVO (cutoff) influenza sensibilità e specificità del test e la loro
massimizzazione contemporanea
DISTRIBUZIONI DEI VALORI DEL TEST NELLE DUE POPOLAZIONI
1)
TEST NEGATIVI
TEST POSITIVI
SOGLIA = 1
SENS =
100%
SPEC = 100%
2)
Il valore di cut-off influenza sia la sensibilità che la
specificità del test.
Esso viene scelto in base ad una serie di considerazioni:
ad esempio, deve essere ben nota la storia naturale
della malattia, nonché le conseguenze sanitarie ed
economiche dei falsi negativi e dei falsi positivi.
Nel caso di alcune malattie infettive, talvolta anche
un solo falso negativo può risultare
particolarmente pericoloso, in quanto escretore
dell'agente di malattia e quindi “disseminatore” del
contagio.
LA SCELTA MIGLIORE E’
QUELLA DEL COMPROMESSO
Esempio: esame clinico dei linfonodi (confrontato
con il test Gold standard dell’esame istologico dei
linfonodi) per la diagnosi di metastasi di tumori
solidi
SCELTA DEL CUT-OFF: PRIVILEGIARE LA
SENSIBILITA’ O LA SPECIFICITA’
UN TEST SENSIBILE DOVREBBE ESSERE SCELTO
QUANDO LE CONSEGUENZE DI UNA MANCATA
DIAGNOSI SONO PARTICOLARMENTE GRAVI (es.
malattie ad esito solitamente mortale, ma che possono
essere efficacemente curate).
I test sensibili sono utili anche durante il processo
diagnostico iniziale, al fine di ridurre il ventaglio di
possibilità (diagnosi differenziale) quando esso è ampio. In
tal caso, il test sensibile viene applicato soprattutto allo
scopo di escludere una o più malattie. Infatti, un test
sensibile è di maggior aiuto al clinico quando fornisce un
risultato negativo.
UN TEST SPECIFICO E’ PARTICOLARMENTE UTILE
QUANDO UN RISULTATO FALSO POSITIVO E’
PARTICOLARMENTE DANNOSO (sotto l'aspetto organico,
emotivo per il proprietario, finanziario ecc.).
LE CURVE R.O.C.
(Receiver Operating Characteristic)
Le Curve ROC sono un ulteriore e più moderno approccio per
valutare la capacità discriminatoria di un Test (ACCURATEZZA
DIAGNOSTICA).
Questa rappresentazione grafica :Traccia la probabilità di un
risultato vero positivo (sensibilità) in funzione della probabilità di
un risultato falso positivo per una serie di punti di cut-off
Le curve ROC si utilizzano per:
-Scegliere
il valore soglia + o – consono alle conseguenze
diagnostiche del test in base ai punti che formano la retta
-Paragonare
due diversi Test per la diagnosi della stessa malattia
in base alla grandezza dell’area sotto le curve
DISEGNARE LE CURVE ROC
La curva si ottiene a partire dai valori di sensibilità e di specificità del
test a varie soglie mediante la rappresentazione di punti in un piano
cartesiano i cui assi sono definiti da “Sensibilità” e “1 – Specificità”
A
A
TEST
TEST
TEST
TEST
PERFETTO
INUTILE
A
B
TEST SENS=SPE


LE CURVE PARTONO SEMPRE DAL PUNTO (SE=0,
SP=1) CHE INDICA CHE NESSUN PAZIENTE
RISULTERA’ POSITIVO AL TEST E TERMINANO
NEL PUNTO (SE=1,SP=0) CHE EQUIVALE A DIRE
CHE TUTTI I SOGGETTI RISULTERANNO
POSITIVI AL TEST
UN TEST INFALLIBILE E’ QUELLO NEL QUALE
ESISTE UNA SOGLIA TALE PER CUI LA CURVA
COINCIDE CON IL PUNTO (SE=1, SP=1), L’AREA
SOTTO LA CURVA IN QUESTO CASO E’ UGUALE
A1



IL TEST PEGGIORE E’ QUELLO CHE GENERA UN
NUMERO DI VERI POSITIVI UGUALE A QUELLI DI
FALSI NEGATIVI, L’AREA SOTTO LA CURVA IN
QUESTO CASO E’ 0.5
PIU’ LA CURVA E’ ARCUATA VERSO IL PUNTO DI
MASSIMO, MIGLIORE E’ LA CAPACITA’
DISCRIMINATORIA DEL TEST (AREA GRIGIA
AREA DI ERRORE)
IL PUNTO DI MASSIMO DELLA CURVA E’ QUELLO
PIU’ VICINO ALL’ANGOLO IN ALTO A SINISTRA,
IN QUESTO PUNTO SI MASSIMIZZANO
CONTEMPORANEAMENTE SENSIBILITA’ E
SPECIFICITA’
•NON SEMPRE SIAMO INTERESSATI AL PUNTO DI
MASSIMO DELLA CURVA, NEI TEST DI
SCREENING PER CANCRO INFATTI SI
PREDILIGONO SOGLIE CHE MASSIMIZZANO LA
SENSIBILITA’ A SCAPITO DI MOLTI FALSI
POSITIVI CHE VERRANNO DIAGNOSTICATI IN
MANIERA CORRETTA CON SUCCESSIVI TEST
•NEL CASO DI TEST MISURATI SU SCALA
CONTINUA LA CURVA ROC E’ FONDAMENTALE PER
IDENTIFICARE I VALORI OTTIMI DI CUT-OFF
DEFINIRE IL CUT-OFF DI UN TEST
ESEMPIO
Hanley e McNeil condussero nel 1982 uno studio su 109 soggetti, 58 sani e
51 con malattie psichiatriche. Ogni soggetto fu sottoposto ad un test, i
punteggi ottenuti variarono da 1 a 5 e a valori alti di punteggio è associata
una maggiore presenza di “anomarmalità” del soggetto: 1-definitivamente
normale, 2- probabilmente normale, 3 – dubbio, - 4- probabilmente
anormale, 5- definitivamente anormale.
La costruzione della CURVA ROC in questo caso servì per capire quale
poteva essere il valore di cut-poin da utilizzare in questo test per
classificare i soggetti come normali o come anormali
punteggio del test
1
2
3
4
5 |
Total
-----------+-------------------------------------------------------+---------malato 1 |
3
2
2
11
33 |
51
sano 0 |
33
6
6
11
2 |
58
-----------+-------------------------------------------------------+---------Total |
36
8
8
22
35 |
109
0.00
0.25
0.50
0.75
1.00
CURVA ROC
0.00
0.25
0.50
1 - Specificity
0.75
Area under ROC curv e = 0.8932
Detailed report of Sensitivity and Specificity
-----------------------------------------------------Correctly
Cut point
Sensitivity
Specificity
Classified
-----------------------------------------------------( >= 1 )
100.00%
0.00%
46.79%
( >= 2 )
94.12%
56.90%
74.31%
( >= 3 )
90.20%
67.24%
77.98%
( >= 4 )
86.27%
77.59%
81.65%
( >= 5 )
64.71%
96.55%
81.65%
( > 5 )
0.00%
100.00%
53.21%
-------------------------------------------------------
1.00
UTILIZZO DELLA CURVA ROC PER
CONFRONTARE DUE TEST
SENSIBILITA’
CURVA ROC
1- SPECIFICITA’
Importanza pratica di un test
Nell’ambito delle operazioni di screening di una
popolazione o nell’attività diagnostica ambulatoriale,
quando si interpretano i risultati di un test
diagnostico, lo specialista è chiamato a rispondere alla
domanda:
QUAL’E’ LA PROBABILITA’ CHE IL SOGGETTO SIA
REALMENTE MALATO (SANO) DATO CHE E’
RISULTATO POSITIVO (NEGATIVO) AL TEST?
-
Valore predittivo positivo (PPV) = P(M+|T+)
-
Valore predittivo negativo (NPV) = P(M-|T-)
Valore Predittivo Positivo:
applicazione del teorema di Bayes
(PPV): P(M+|T+) = [P(T+|M+)P(M+)]/P(T+)
Probabilità a posteriori = (Sensibilità x Prevalenza)/P(T+)
•P(M) = Probabilità a priori o prevalenza
•P(T+)= P(T+|M+)P(M+)+P(T+|M-)P(M-)
•Sens/P(T+) è la verosimiglianza della malattia dato l’esito positivo del
test
STIMA DEL PPV = P(M+T+)/P(T+)
Valore Predittivo Negativo: applicazione del
teorema di Bayes
(PNV): P(M-|T-) = [P(T-|M-)P(M-)]/P(T-)
Probabilità a posteriori = (Specificità x (1-Prevalenza))/P(T-)


P(T-)= P(T-|M-)P(M-)+P(T-|M+)P(M+)
Spec/P(T-) è la verosimiglianza dell’assenza di malattia
dato l’esito negativo del test
STIMA DEL PNV = P(M-T-)/P(T-)
Esempio sull’importanza pratica di un test
La prevalenza di una determinata malattia nella popolazione di
interesse è del 6%.
Il test diagnostico su tale malattia ha una sensibilità del 93% e
una specificità dell’88%.
Qual è la probabilità che un soggetto sia malato se è risultato
positivo al test?
P(M+)= 0.06 P(T+| M+ )=0.93 P(T-|M- )=0.88
-P(M+ |T+) = P(T+| M+)P(M+)/P(T+)
P(T+) = P(T+ e M+)+P(T+ e M- )=(P(T+| M+ )P(M+))+(P(T+|M-)P(M-))
=0.93 x 0.06 +(1-0.88)x(1-0.06)= 0.93x0.06+0.12x0.94=
= 0.06+0.11=0.17
PPV=P(M+|T+)=(0.93x0.06)/0.17=0.33
Decisione diagnostica e prevalenza di malattia nella
popolazione considerata
La decisione diagnostica (PPV, NPV) non dipende
solo dall’efficienza del test (sensibilità e
specificità), ma anche dalla prevalenza della
malattia nella popolazione considerata


Maggiore (Minore) è la prevalenza, maggiore
(minore) è il valore predittivo positivo del
test (a parità di sensibilità e specificità)
L'influenza della prevalenza sul valore
predittivo è proporzionale al decrescere
della sensibilità e specificità del test
Il fatto che il valore predittivo positivo dipenda
dalla prevalenza sconsiglia l'effettuazione di
azioni di screening per malattie rare
Uno screening per una malattia rara presenta i
seguenti inconvenienti:
1. Pochi individui ne trarranno beneficio (proprio
in quanto malattia rara)
2. molti individui (i falsi-positivi) ne trarranno un
danno, in quanto verranno ingiustamente
considerati ammalati
Esempio
Test di screening (basato sul dosaggio degli anticorpi) per i donatori
di sangue per individuare eventuale sangue infetto da HIV
Sensibilità = 0.85
Specificità = 0.99
Prevalenza pop 1= 0,001
Prevalenza pop 2=0,1


Popolazione 1: donatori di sangue (basso num donatori affetti da HIV)
odds a priori=P(M+)/P(M-) = 0.001
LR= sensibilità/(1-specificità) = 0.85/0.01=85
odds a posteriori = odds a priori x LR= 0.001x85=0.085
probabilità a posteriori=odds/1+odds = 0,085/1,085 = 0,078
Popolazione 2: tossicodipendenti
odds a priori = 0.1
LR= 85
odds a posteriori = 0.1x85 = 8.5
probabilità a posteriori = 8,5/9,5= 0,89
RAPPORTO DI VEROSIMIGLIANZA
Un’altra misura utile nella valutazione dell’importanza pratica di un test
diagnostico è il RAPPORTO DI VEROSIMIGLIANZA DI UN ESITO DEL
TEST.
Dato l’esito positivo del test (T+) la verosimiglianza della malattia è data da
V(M+ e T+) = Sens/P(T+) = P(T+|M+)/P(T+)
La verosimiglianza dell’assenza di malattia dato l’esito positivo è invece
V(M- e T+) = 1- Spec/P(T+) = P(T+|M-)/P(T+)
Dato l’esito negativo del test (T-) la verosimiglianza della malattia è data da
V(M+ e T-) = 1- Sens /P(T-) = P(T-|M+)/P(T-)
La verosimiglianza dell’assenza di malattia dato l’esito positivo è invece
V(M- e T-) = Spec /P(T-) = P(T-|M-)/P(T-)
RAPPORTO DI VEROSIMIGLIANZA DI UN ESITO POSITIVO
LR+=Sens/1-Spec
RAPPORTO DI VEROSIMIGLIANZA DI UN ESITO NEGATIVO
LR- =Spec/1-Sens
L’LR
 Fornisce una misura della certezza della diagnosi dato il risultato del
test (positivo o negativo)
 Non dipende dalla proporzione di positivi al test P(T+)
 Non dipende dalla Prevalenza P(M+)
Un LR+>1 indica che il risultato del test è associato con la presenza della
malattia
Un LR-<1 indica che il risultato del test è associato con l’assenza della
malattia
Odds di malattia
L’odds di un evento (malattia) si ottiene facendo il
rapporto tra la probabilità che l’evento accada e il
suo complemento a 1 (evento non accade):
Odds (a priori)=P(M+)/P(M-)=P(M+)/(1-P(M+))
Esempio:
Su 125 soggetti 25 sono ammalati:
Odds=25/100=0.25
Ogni 4 soggetti sani ne ho uno malato
Odds a posteriori ed evidenza empirica
Supponiamo di effettuare un test di screening e di voler
aggiornare l’odds (a priori) sulla base del risultato del test:
Odds a posteriori = P(M+|T+)/P(M-|T+)=
(P(M+) x P(T+|M+)/P(T+))
(P(M-) x P(T+|M-)/P(T+))=
Odds a priori x P(T+|M+)/P(T+|M-)=
Odds a priori x Rapporto di Verosimiglianza
(sensibilità/1-Specificità)
Importante: per aggiornare l’Odds non è necessario conoscere la
proporzione di soggetti risultati positivi al test, perché il rapporto
di verosimiglianza non dipende da tale quantità
Esempio
Test basato sulla fosfocreatinchinasi per la diagnosi
di infarto del miocardio (Smith,1967)
Casi
Non
casi
T+
215
16
231
T-
15
114
129
230
130
360
Odds a priori = (230/360)/(130/360)=230/130 = 1.77
LR(+) = sensibilità/(1-specificità)=0.93/(1-0.88) = 7.75
Odds a posteriori = Odds a priori x LR=1.77 x 7.75 = 13.7
Probabilità a posteriori = odds/1+odds =
= 13.7/14.7 = 0,93
RIPRODUCIBILITA’ DELLE MISURE CLINICHE
Fino ad ora abbiamo affrontato l’argomento relativo alla
validità (incertezza) diagnostica intesa come l’aderenza tra
il giudizio clinico dello stato del paziente e lo stato vero
del paziente stesso attraverso l’utilizzo dei test
diagnostici
E’ presente però una seconda componente di errore insito
nella formulazione del giudizio clinico che si riferisce alla
riproducibilità del giudizio (misura), ovvero all’aderenza tra
il giudizi sullo stato di un paziente formulati da più clinici o
da un unico clinico in occasione di più visite o di più
misurazioni.
Di Particolare interesse in questo contesto è la capacità
di accordo tra osservatori diversi.
LA CONCORDANZA DIAGNOSTICA
Supponiamo che due medici debbano esprimano una
diagnosi relativa allo stato di salute di uno stesso
paziente (variabile categorica o ordinale).
Supponiamo per semplicità che il giudizio diagnostico sia
semplicemente: malato/sano.
Le due diagnosi potranno essere concordi o discordi:
Medico A
Malato
Malato
Sano
Sano
Medico B
Malato
Sano
Sano
Malato
concordanza
discordanza
concordanza
discordanza
ESEMPIO
Supponiamo che i due medici debbano esaminare 29
pazienti, i dati relativi ai loro giudizi diagnostici
possono essere riassunti in una tabella di contingenza
2X2:
Medico A
Medico B Sano
Malato
Sano
10
7
Malato
0
12
Le concordanze OSSERVATE sono 22 ( 76%)
Le discordanze OSSERVATE sono 7 (24%)
Misurare la concordanza diagnostica


Misurare la CONCORDANZA semplicemente
calcolando la percentuale di diagnosi concordanti è
piuttosto superficiale perché non si considera che i
clinici potrebbero concordare nella diagnosi per
puro effetto del caso
La misura corretta che si deve utilizzare per
valutare la vera proporzione di accordo ( al netto
dell’effetto del caso), cioè quella legata all’utilizzo
di criteri omogenei e oggettivi di valutazione del
materiale disponibile è l’INDICE K
L’Indice Kappa di Cohen
P(accordo) osservata  P(accordo) attesa
Kappa 
1  P(accordo) attesa
La probabilità di accordo osservata è in parte dovuta al caso, in
parte una legata alle caratteristiche dei pazienti.
Di solito quindi la concordanza osservata è maggiore di quella che
si osserverebbe se i due medici agissero a caso, quindi
Kappa >= 0
In teoria però il valore di K può variare tra –1 ed 1
-1 <= Kappa <= 1
Esempio
Medico A
Medico A
PA(sano) = 10/29 = 0.345
Medico B
Sano
Malato
PA(malato) = 19/29=1-0.345 = 0.655
Sano
10
7
Malato
0
12
Medico B
PB(sano) = (10+7)/29 = 17/29 = 0.586
PB(malato)=12/29=1- 0.586 = 0.414
Probabilità di concordanza osservata=(10+12)/29=22/29=0.759
Probabilità di concordanza attesa sotto l’ipotesi di “diagnosi casuale” :
P(concordanza sano)=PA(sano) x PB(sano) = 0.345 x 0.586=0.202
P(concordanza malato)=PA(malato) x PB(malato) = 0.655 x 0.414=0.271
P(concordanza)=P(concordanza sano)+P(concordanza malato) = 0.202+0.271=0.473
Kappa 
P(accordo) osservata  P(accordo) attesa 0.759  0.473

 0.54
1  P(accordo) attesa
1  0.473