Estratto da Il Fisioterapista 1-2013
BIOMEDICAL STATISTICS & CLINICAL EPIDEMIOLOGY
Interpretazione
di un test diagnostico
Massimo Bitocchi
Fisioterapista, Orthopaedic Manipulative Therapist – IFOMPT, Loreto (AN)
Questa sezione è stata creata con lo scopo di fornire elementi di base in materia di epidemiologia e biostatistica. Molto si parla di evidence-based medicine e nel nostro caso di evidence-based
physiotherapy ed evidence-based practice, ma questi temi si intersecano strettamente e non sarebbe possibile scinderli. Un professionista dedicato e coscienzioso dovrebbe possedere capacità
critiche sufficienti in modo tale da poter filtrare efficientemente la letteratura biomedica esaminata. Dovrebbe riuscire a reperire in letteratura quale sia il test gold standard utilizzato per testare una
determinata struttura fisica e valutare le potenzialità dello stesso in termini di sensibilità, specificità, valore
predittivo eccetera; dovrebbe poter giudicare le conclusioni alle quali perviene uno studio così poi da poter
arricchire la propria pratica clinica di trattamenti con provato effetto positivo sugli outcome di riferimento
e vantaggiosi dal punto di vista costi-benefici.
Per raggiungere tali obiettivi si cercherà di trattare sinteticamente e in maniera analitica gli studi primari
e i principali studi secondari affrontando di volta in volta le loro caratteristiche di base e gli elementi
statistici peculiari degli stessi. Attraverso questi approfondimenti si dovrebbero migliorare le proprietà
interpretative degli operatori sanitari durante la lettura e le analisi degli studi biomedici disponibili in
letteratura scientifica.
“L
a diagnosi – il primo passo nella gestione clinica, è un
potente fattore determinante di
interventi e impiego medico di
risorse per l’assistenza sanitaria.
Essa richiede di interpretare la
storia dei pazienti, le osservazioni
cliniche, i risultati dei test di laboratorio o di studi di imaging; tutti
questi elementi rappresentano
«prove» effettuate per aiutare i
medici ad affinare la stima della
probabilità che un paziente abbia
una particolare condizione patologica”1. “La diagnosi definitiva
Nel prossimo numero
persona senza la malattia e solitamente è descritta in termini di
sensibilità (sensitivity), specificità
(specificity), valore predittivo positivo (positive predictive value) e
valore predittivo negativo (negative predictive value)2.
Il tradizionale metodo per
comprendere questi concetti è
basato sulla compilazione di una
tabella di contingenza a doppia
entrata 2 × 2 (figura 1).
SENSIBILITÀ
1 – Gennaio/Febbraio 2013
La sensibilità di un test, definita
come la proporzione di persone positive al test tra quelle che
presentano la condizione, è calcolata dal rapporto tra le persone con malattia risultate positive
al test (A, veri positivi) con il numero totale di persone malate (A
+ C, veri positivi + falsi negativi)
(figura 2).
Ciò significa che la sensibilità
di un test indica solamente quanto è valido il test per identificare
Il Fisioterapista
re il
Come applica
enceconcetto evid
ine negli
based medic
tici
studi diagnos
è poco comune: i medici spesso
misurano implicitamente l’incertezza diagnostica con l’uso di
termini come “certo”, probabilmente, “forse”, e quindi stimano
la probabilità della presenza di
una condizione. Il grado di certezza necessario per una particolare diagnosi in un particolare paziente dipende dai possibili rischi
e benefici della terapia e dalle
preferenze del paziente riguardo
esami e trattamento”1.
Utilizzare un particolare strumento di misura in pratica clinica, come potrebbe essere un
test diagnostico, presuppone
che esso possa fornire dati affidabili ai fini dei risultati ai quali
perviene. Per essere considerato
un buon test, una volta effettuato il percorso di validazione, esso
deve fornire caratteristiche di validità, riproducibilità e accuratezza; l’utilità di un test diagnostico
è rappresentata dalla sua abilità nell’individuare un soggetto
con la malattia o escludere una
73
37-84_Guide.indd 73
01/02/13 17:05
Estratto da Il Fisioterapista 1-2013
BIOMEDICAL STATISTICS & CLINICAL EPIDEMIOLOGY
Interpretazione di un test diagnostico
Condizione/malattia
Test
Positivo
Negativo
Figura 1
Presente
Assente
A
Veri positivi
B
Falsi positivi
C
Falsi negativi
D
Veri negativi
Tabella di contingenza a doppia entrata.
persone con malattia, analizzando però solo chi presenta la malattia. Al contrario, non fornisce
informazioni se alcune persone
senza la malattia risultano positive al test e, qualora ciò avvenga,
non indica in quale proporzione.
Un test con una sensibilità molto alta si rivela utile nella pratica
clinica quando il risultato del test
stesso è negativo; infatti, dal momento che un test molto sensibile
ha un’alta capacità di individuare
veri positivi, ci saranno pochi falsi
negativi. L’acronimo SNNOUT (high
Sensitivity, Negative test, rule out)
è un utile supporto mnemonico
per ricordare questo principio3.
SPECIFICITÀ
La specificità di un test rappresenta, invece, la proporzione
di persone negative al test tra
quelle che non presentano la
condizione/malattia, è possibile
calcolarla attraverso il rapporto
tra le persone che non presentano la condizione/malattia e sono
risultate negative al test (D, veri
negativi) con il numero totale di
persone non malate (B + D, falsi
positivi + veri negativi) (figura 2).
A differenza della sensibilità, in
questo caso il risultato da considerare in pratica clinica è quello
positivo, poiché un test molto
specifico riesce a individuare i veri
negativi, riducendo la percentuale
dei falsi positivi; quindi un risultato
positivo del test possiede un’altissima percentuale di probabilità
di rappresentare un vero positivo.
L’acronimo utile per memorizzare il principio alla base di questo
concetto è SPPIN (high Specificity,
Positive test, rule IN)3.
VALORE PREDITTIVO
“Il punto centrale di un test diagnostico è la possibilità di utiliz-
Pazienti malati
A
Test positivo
Pazienti senza malattia
+
+
C
Il Fisioterapista
1 – Gennaio/Febbraio 2013
Test negativo
Numero totale
di pazienti malati (A + C)
Figura 2
zarlo per fare diagnosi per questo
abbiamo bisogno di conoscere la
probabilità che il test possa fornire una diagnosi corretta”4.
Mentre la sensibilità e la specificità di un test sono misure
importanti di precisione e accuratezza del test stesso, esse non
sono utili nella pratica quando è
necessario stimare la probabilità
di malattia in un paziente individuale; questo perché entrambe
le misure sono definite sulla base
di persone con o senza la condizione/malattia.
I valori predittivi positivi e negativi descrivono la probabilità
del paziente di avere o non avere
la malattia, una volta che si conoscono i risultati del test.
Il valore predittivo positivo
(positive predictive value) di un
test rappresenta la probabilità
che un soggetto, risultato positivo al test, abbia effettivamente
la condizione/malattia. Lo si calcola attraverso il rapporto tra i
veri positivi (A, veri positivi) con
la somma dei soggetti positivi
al test (A + B, veri positivi + falsi
positivi) (figura 2).
Il valore predittivo negativo (negative predictive value), al contrario, determina la probabilità che
una persona negativa al test non
presenti realmente la condizione/
malattia e lo si ottiene rapportando i veri negativi (D, veri negativi)
con la somma dei soggetti nega-
Totale test positivi
(A + B)
B
+
+
Totale test negativi
(C + D)
D
Numero totale di pazienti
senza malattia (B + D)
Numero totale di pazienti
(A + B + C + D)
Formule per il calcolo delle misure di precisione del test.
74
37-84_Guide.indd 74
01/02/13 17:05
Estratto da Il Fisioterapista 1-2013
RAPPORTO
DI VEROSIMIGLIANZA
Tabella 1 Rapporti tra valori predittivi
e prevalenze di una malattia
Prevalenza (%)
Valore predittivo
positivo (%)
negativo (%)
5
10
99
10
62
98
20
76
95
40
89
87
50
93
82
60
96
76
permette di stimare la probabilità post-test. In pratica clinica
vi sono due possibilità di impiegare il teorema di Bayes per
stimare la probabilità post-test:
effettuando il calcolo matematico diretto oppure utilizzando
il nomogramma di Fagan (figura 3).
Si rimanda il lettore in altra
Teorema di Bayes
Il teorema di Bayes rappresenta
una relazione matematica che
Figura 3
Nomogramma di Fagan.
1 – Gennaio/Febbraio 2013
Il rapporto di verosimiglianza
negativo si calcola rapportando
il reciproco della sensibilità con
la specificità (LR- = 1 – sensibilità/specificità) e determina la
probabilità che una persona risultata negativa al test presenti
in verità la condizione/malattia.
La probabilità stimata di una
malattia prima che il risultato del
test sia noto è denominata probabilità pre-test (pre-test probability) e solitamente è considerata sulla base dell’esperienza
personale, di dati di prevalenza
locali e report pubblicati6. La più
importante ragione per la quale
si esegue un test è cercare di ottenere informazioni aggiuntive
che potrebbero modificare la
probabilità pre-test della malattia. Un test positivo può incrementare la probabilità pre-test,
mentre un test negativo potrebbe ridurla. La probabilità del paziente o la possibilità di avere la
malattia una volta che i risultati
del test siano noti è detta probabilità post-test (post-test probability).
Un rapporto di verosimiglianza positivo (LR+) maggiore di 10
e un rapporto di verosimiglianza negativo (LR-) minore di 0,1
producono significativi e spesso
conclusivi cambiamenti da una
probabilità pre-test a una probabilità post-test7.
Il Fisioterapista
Le misure di sensibilità e specificità non possono essere utilizzate per calcolare le probabilità
di incorrere nella condizione/
malattia; esse possono, tuttavia,
essere combinate in una singola
misura chiamata “rapporto di verosimiglianza” (likelihood ratio,
LR)5, che risulta clinicamente più
utile.
Quando i risultati di un test
sono riportati come positivi o
negativi, due tipi di rapporti di
verosimiglianza possono essere
descritti: il rapporto di verosimiglianza per un test positivo (LR+)
e il rapporto di verosimiglianza
per un test negativo (LR-).
Il rapporto di verosimiglianza
positivo si calcola rapportando
la sensibilità con il reciproco della specificità (LR+ = sensibilità/1
– specificità) e indica quale probabilità abbia un soggetto positivo al test di essere veramente
interessato dalla condizione/malattia in esame.
BIOMEDICAL STATISTICS & CLINICAL EPIDEMIOLOGY
tivi al test (C + D, falsi negativi +
veri negativi) (figura 2).
Il limite che scaturisce da
queste misure di probabilità è
definito dalla stretta relazione
che intercorre con la prevalenza
della condizione/malattia; essa
è costituita dal numero totale di
casi di una data malattia in una
popolazione specifica in un determinato tempo.
Non è questa la sede per riproporre tutti i calcoli utili a spiegare dettagliatamente questa situazione: la tabella 1, tuttavia, è
utile per verificare come un particolare test modifichi i suoi valori predittivi positivi e negativi al
variare della prevalenza.
Alla luce di ciò, sarebbe perciò
errato applicare direttamente i
valori predittivi pubblicati di un
test per le proprie popolazioni;
infatti, la prevalenza della malattia nella propria popolazione sarà
differente dalla prevalenza della
malattia nella popolazione in cui
è stato effettuato lo studio considerato.
Interpretazione di un test diagnostico
75
37-84_Guide.indd 75
01/02/13 17:05
BIOMEDICAL STATISTICS & CLINICAL EPIDEMIOLOGY
Interpretazione di un test diagnostico
Estratto da Il Fisioterapista 1-2013
sede più appropriata per comprendere il calcolo matematico
del teorema di Bayes; è possibile invece illustrare come il nomogramma di Fagan fornisca un
metodo più semplice per servirsi dei rapporti di verosimiglianza di un test.
In questo nomogramma, una
linea dritta tracciata dal valore
della probabilità pre-test della
malattia (asse sinistro) – attraverso il rapporto di verosimiglianza del test (asse centrale)
– intersecherà la probabilità
post-test della malattia (asse
destro). Il valore corrispondente alla probabilità post-test permette al professionista di avere
un’idea ben precisa di quella
che potrebbe essere la probabilità di incappare nella condizione/malattia, da parte del
paziente individuale, una volta
somministrato il test in esame e
ottenuto un risultato, positivo o
negativo.
RIPRODUCIBILITÀ
DI UN TEST
È doveroso fare un’ultima considerazione sulla misura di riproducibilità di un test, caratteristica molto importante perché
assicura una certa affidabilità
affinché il risultato si mantenga,
nonostante le misure vengano
effettuate da operatori differenti. Il K di Cohen esprime per
l’appunto questa misura, che si
definisce “massima” con un valore di 100.
CONCLUSIONI
Risulterebbe molto arduo riuscire a trattare in modo esaustivo
l’argomento con poche righe
in merito. Si è cercato di essere concreti e allo stesso tempo
pratici ai fini della spiegazione
e comprensione delle principali
misure fornite da un test, le quali si rivelano molto utili nella pratica clinica quotidiana di ogni
professionista.
10 RACCOMANDAZIONI UTILI PER UNA MIGLIORE PRATICA CLINICA
Avere un approccio critico, e non passivo,
nei confronti della letteratura scientifica
Evitare di soffermarsi alla sola lettura
dell’abstract di uno studio scientifico
Conoscere i principali database biomedici
dove poter effettuare la ricerca
Possedere una certa dimestichezza
dei termini medici specifici
da utilizzare come keyword
per una ricerca adeguata
Conoscere quali sono i livelli di evidenza
e i gold standard per i disegni
degli studi scientifici
Riconoscere i principali bias
di uno studio medico-scientifico
Sapere interpretare i dati riportati
in uno studio
Rapportare correttamente il proprio paziente
alla popolazione analizzata nello studio
per ponderare adeguatamente le conclusioni
Informare sempre il proprio paziente sulle
evidenze scientifiche disponibili riferite
alla sua condizione patologica
Cercare sempre di adottare un programma
di trattamento basato su “prove di efficacia”
per il nostro paziente
Questi aspetti sono stati e saranno affrontati e approfonditi all’interno degli articoli di questa sezione nei
diversi numeri della rivista
Il Fisioterapista
1 – Gennaio/Febbraio 2013
BIBLIOGRAFIA
1. GILBERT R, LOGAN S, MOYER VA,
ELLIOTT EJ. Assessing diagnostic
and screening tests: Part 1. Concepts. West J Med 2001; 174(6):
405-9.
2. AKOBENG AK. Understanding diagnostic tests 1: sensitivity, specificity and predictive values. Acta
Paediatr 2007; 96(3):338-41.
3. SACKETT DL, STRAUSS SE, RICHARDSON
WS, ROSENBERG W, HAYNES RB. Evi-
dence-based medicine: how to
practice and teach EBM. London:
Churchill-Livingstone, 2000.
4. ALTMAN DG, BLAND JM. Diagnostic tests 2: Predictive values.
BMJ 1994; 309(6947):102.
5. LANG TA, SECIC M. How to report
statistics in medicine: annotated
guidelines for authors, editors,
and reviewers. Philadelphia: American College of Physicians, 1997.
6. ESPALLARDO NL. Decisions on diagnosis in family practice: use of
sensitivity, specificity, predictive
values and likelihood ratios. Asia
Pacific Family Medicine 2003; 2:
229-32.
7. JAESCHEKE R, GUYATT G, LIJMER J.
Diagnostic tests. In: GUYATT G,
RENNIE D, editors. Users’ guides
to the medical literature. Chicago AMA Press 2002:121-40.
„
Ulteriori approfondimenti sono disponibili in
www.ilfisioterapista.it
76
37-84_Guide.indd 76
01/02/13 17:05