Estratto da Il Fisioterapista 1-2013 BIOMEDICAL STATISTICS & CLINICAL EPIDEMIOLOGY Interpretazione di un test diagnostico Massimo Bitocchi Fisioterapista, Orthopaedic Manipulative Therapist – IFOMPT, Loreto (AN) Questa sezione è stata creata con lo scopo di fornire elementi di base in materia di epidemiologia e biostatistica. Molto si parla di evidence-based medicine e nel nostro caso di evidence-based physiotherapy ed evidence-based practice, ma questi temi si intersecano strettamente e non sarebbe possibile scinderli. Un professionista dedicato e coscienzioso dovrebbe possedere capacità critiche sufficienti in modo tale da poter filtrare efficientemente la letteratura biomedica esaminata. Dovrebbe riuscire a reperire in letteratura quale sia il test gold standard utilizzato per testare una determinata struttura fisica e valutare le potenzialità dello stesso in termini di sensibilità, specificità, valore predittivo eccetera; dovrebbe poter giudicare le conclusioni alle quali perviene uno studio così poi da poter arricchire la propria pratica clinica di trattamenti con provato effetto positivo sugli outcome di riferimento e vantaggiosi dal punto di vista costi-benefici. Per raggiungere tali obiettivi si cercherà di trattare sinteticamente e in maniera analitica gli studi primari e i principali studi secondari affrontando di volta in volta le loro caratteristiche di base e gli elementi statistici peculiari degli stessi. Attraverso questi approfondimenti si dovrebbero migliorare le proprietà interpretative degli operatori sanitari durante la lettura e le analisi degli studi biomedici disponibili in letteratura scientifica. “L a diagnosi – il primo passo nella gestione clinica, è un potente fattore determinante di interventi e impiego medico di risorse per l’assistenza sanitaria. Essa richiede di interpretare la storia dei pazienti, le osservazioni cliniche, i risultati dei test di laboratorio o di studi di imaging; tutti questi elementi rappresentano «prove» effettuate per aiutare i medici ad affinare la stima della probabilità che un paziente abbia una particolare condizione patologica”1. “La diagnosi definitiva Nel prossimo numero persona senza la malattia e solitamente è descritta in termini di sensibilità (sensitivity), specificità (specificity), valore predittivo positivo (positive predictive value) e valore predittivo negativo (negative predictive value)2. Il tradizionale metodo per comprendere questi concetti è basato sulla compilazione di una tabella di contingenza a doppia entrata 2 × 2 (figura 1). SENSIBILITÀ 1 – Gennaio/Febbraio 2013 La sensibilità di un test, definita come la proporzione di persone positive al test tra quelle che presentano la condizione, è calcolata dal rapporto tra le persone con malattia risultate positive al test (A, veri positivi) con il numero totale di persone malate (A + C, veri positivi + falsi negativi) (figura 2). Ciò significa che la sensibilità di un test indica solamente quanto è valido il test per identificare Il Fisioterapista re il Come applica enceconcetto evid ine negli based medic tici studi diagnos è poco comune: i medici spesso misurano implicitamente l’incertezza diagnostica con l’uso di termini come “certo”, probabilmente, “forse”, e quindi stimano la probabilità della presenza di una condizione. Il grado di certezza necessario per una particolare diagnosi in un particolare paziente dipende dai possibili rischi e benefici della terapia e dalle preferenze del paziente riguardo esami e trattamento”1. Utilizzare un particolare strumento di misura in pratica clinica, come potrebbe essere un test diagnostico, presuppone che esso possa fornire dati affidabili ai fini dei risultati ai quali perviene. Per essere considerato un buon test, una volta effettuato il percorso di validazione, esso deve fornire caratteristiche di validità, riproducibilità e accuratezza; l’utilità di un test diagnostico è rappresentata dalla sua abilità nell’individuare un soggetto con la malattia o escludere una 73 37-84_Guide.indd 73 01/02/13 17:05 Estratto da Il Fisioterapista 1-2013 BIOMEDICAL STATISTICS & CLINICAL EPIDEMIOLOGY Interpretazione di un test diagnostico Condizione/malattia Test Positivo Negativo Figura 1 Presente Assente A Veri positivi B Falsi positivi C Falsi negativi D Veri negativi Tabella di contingenza a doppia entrata. persone con malattia, analizzando però solo chi presenta la malattia. Al contrario, non fornisce informazioni se alcune persone senza la malattia risultano positive al test e, qualora ciò avvenga, non indica in quale proporzione. Un test con una sensibilità molto alta si rivela utile nella pratica clinica quando il risultato del test stesso è negativo; infatti, dal momento che un test molto sensibile ha un’alta capacità di individuare veri positivi, ci saranno pochi falsi negativi. L’acronimo SNNOUT (high Sensitivity, Negative test, rule out) è un utile supporto mnemonico per ricordare questo principio3. SPECIFICITÀ La specificità di un test rappresenta, invece, la proporzione di persone negative al test tra quelle che non presentano la condizione/malattia, è possibile calcolarla attraverso il rapporto tra le persone che non presentano la condizione/malattia e sono risultate negative al test (D, veri negativi) con il numero totale di persone non malate (B + D, falsi positivi + veri negativi) (figura 2). A differenza della sensibilità, in questo caso il risultato da considerare in pratica clinica è quello positivo, poiché un test molto specifico riesce a individuare i veri negativi, riducendo la percentuale dei falsi positivi; quindi un risultato positivo del test possiede un’altissima percentuale di probabilità di rappresentare un vero positivo. L’acronimo utile per memorizzare il principio alla base di questo concetto è SPPIN (high Specificity, Positive test, rule IN)3. VALORE PREDITTIVO “Il punto centrale di un test diagnostico è la possibilità di utiliz- Pazienti malati A Test positivo Pazienti senza malattia + + C Il Fisioterapista 1 – Gennaio/Febbraio 2013 Test negativo Numero totale di pazienti malati (A + C) Figura 2 zarlo per fare diagnosi per questo abbiamo bisogno di conoscere la probabilità che il test possa fornire una diagnosi corretta”4. Mentre la sensibilità e la specificità di un test sono misure importanti di precisione e accuratezza del test stesso, esse non sono utili nella pratica quando è necessario stimare la probabilità di malattia in un paziente individuale; questo perché entrambe le misure sono definite sulla base di persone con o senza la condizione/malattia. I valori predittivi positivi e negativi descrivono la probabilità del paziente di avere o non avere la malattia, una volta che si conoscono i risultati del test. Il valore predittivo positivo (positive predictive value) di un test rappresenta la probabilità che un soggetto, risultato positivo al test, abbia effettivamente la condizione/malattia. Lo si calcola attraverso il rapporto tra i veri positivi (A, veri positivi) con la somma dei soggetti positivi al test (A + B, veri positivi + falsi positivi) (figura 2). Il valore predittivo negativo (negative predictive value), al contrario, determina la probabilità che una persona negativa al test non presenti realmente la condizione/ malattia e lo si ottiene rapportando i veri negativi (D, veri negativi) con la somma dei soggetti nega- Totale test positivi (A + B) B + + Totale test negativi (C + D) D Numero totale di pazienti senza malattia (B + D) Numero totale di pazienti (A + B + C + D) Formule per il calcolo delle misure di precisione del test. 74 37-84_Guide.indd 74 01/02/13 17:05 Estratto da Il Fisioterapista 1-2013 RAPPORTO DI VEROSIMIGLIANZA Tabella 1 Rapporti tra valori predittivi e prevalenze di una malattia Prevalenza (%) Valore predittivo positivo (%) negativo (%) 5 10 99 10 62 98 20 76 95 40 89 87 50 93 82 60 96 76 permette di stimare la probabilità post-test. In pratica clinica vi sono due possibilità di impiegare il teorema di Bayes per stimare la probabilità post-test: effettuando il calcolo matematico diretto oppure utilizzando il nomogramma di Fagan (figura 3). Si rimanda il lettore in altra Teorema di Bayes Il teorema di Bayes rappresenta una relazione matematica che Figura 3 Nomogramma di Fagan. 1 – Gennaio/Febbraio 2013 Il rapporto di verosimiglianza negativo si calcola rapportando il reciproco della sensibilità con la specificità (LR- = 1 – sensibilità/specificità) e determina la probabilità che una persona risultata negativa al test presenti in verità la condizione/malattia. La probabilità stimata di una malattia prima che il risultato del test sia noto è denominata probabilità pre-test (pre-test probability) e solitamente è considerata sulla base dell’esperienza personale, di dati di prevalenza locali e report pubblicati6. La più importante ragione per la quale si esegue un test è cercare di ottenere informazioni aggiuntive che potrebbero modificare la probabilità pre-test della malattia. Un test positivo può incrementare la probabilità pre-test, mentre un test negativo potrebbe ridurla. La probabilità del paziente o la possibilità di avere la malattia una volta che i risultati del test siano noti è detta probabilità post-test (post-test probability). Un rapporto di verosimiglianza positivo (LR+) maggiore di 10 e un rapporto di verosimiglianza negativo (LR-) minore di 0,1 producono significativi e spesso conclusivi cambiamenti da una probabilità pre-test a una probabilità post-test7. Il Fisioterapista Le misure di sensibilità e specificità non possono essere utilizzate per calcolare le probabilità di incorrere nella condizione/ malattia; esse possono, tuttavia, essere combinate in una singola misura chiamata “rapporto di verosimiglianza” (likelihood ratio, LR)5, che risulta clinicamente più utile. Quando i risultati di un test sono riportati come positivi o negativi, due tipi di rapporti di verosimiglianza possono essere descritti: il rapporto di verosimiglianza per un test positivo (LR+) e il rapporto di verosimiglianza per un test negativo (LR-). Il rapporto di verosimiglianza positivo si calcola rapportando la sensibilità con il reciproco della specificità (LR+ = sensibilità/1 – specificità) e indica quale probabilità abbia un soggetto positivo al test di essere veramente interessato dalla condizione/malattia in esame. BIOMEDICAL STATISTICS & CLINICAL EPIDEMIOLOGY tivi al test (C + D, falsi negativi + veri negativi) (figura 2). Il limite che scaturisce da queste misure di probabilità è definito dalla stretta relazione che intercorre con la prevalenza della condizione/malattia; essa è costituita dal numero totale di casi di una data malattia in una popolazione specifica in un determinato tempo. Non è questa la sede per riproporre tutti i calcoli utili a spiegare dettagliatamente questa situazione: la tabella 1, tuttavia, è utile per verificare come un particolare test modifichi i suoi valori predittivi positivi e negativi al variare della prevalenza. Alla luce di ciò, sarebbe perciò errato applicare direttamente i valori predittivi pubblicati di un test per le proprie popolazioni; infatti, la prevalenza della malattia nella propria popolazione sarà differente dalla prevalenza della malattia nella popolazione in cui è stato effettuato lo studio considerato. Interpretazione di un test diagnostico 75 37-84_Guide.indd 75 01/02/13 17:05 BIOMEDICAL STATISTICS & CLINICAL EPIDEMIOLOGY Interpretazione di un test diagnostico Estratto da Il Fisioterapista 1-2013 sede più appropriata per comprendere il calcolo matematico del teorema di Bayes; è possibile invece illustrare come il nomogramma di Fagan fornisca un metodo più semplice per servirsi dei rapporti di verosimiglianza di un test. In questo nomogramma, una linea dritta tracciata dal valore della probabilità pre-test della malattia (asse sinistro) – attraverso il rapporto di verosimiglianza del test (asse centrale) – intersecherà la probabilità post-test della malattia (asse destro). Il valore corrispondente alla probabilità post-test permette al professionista di avere un’idea ben precisa di quella che potrebbe essere la probabilità di incappare nella condizione/malattia, da parte del paziente individuale, una volta somministrato il test in esame e ottenuto un risultato, positivo o negativo. RIPRODUCIBILITÀ DI UN TEST È doveroso fare un’ultima considerazione sulla misura di riproducibilità di un test, caratteristica molto importante perché assicura una certa affidabilità affinché il risultato si mantenga, nonostante le misure vengano effettuate da operatori differenti. Il K di Cohen esprime per l’appunto questa misura, che si definisce “massima” con un valore di 100. CONCLUSIONI Risulterebbe molto arduo riuscire a trattare in modo esaustivo l’argomento con poche righe in merito. Si è cercato di essere concreti e allo stesso tempo pratici ai fini della spiegazione e comprensione delle principali misure fornite da un test, le quali si rivelano molto utili nella pratica clinica quotidiana di ogni professionista. 10 RACCOMANDAZIONI UTILI PER UNA MIGLIORE PRATICA CLINICA Avere un approccio critico, e non passivo, nei confronti della letteratura scientifica Evitare di soffermarsi alla sola lettura dell’abstract di uno studio scientifico Conoscere i principali database biomedici dove poter effettuare la ricerca Possedere una certa dimestichezza dei termini medici specifici da utilizzare come keyword per una ricerca adeguata Conoscere quali sono i livelli di evidenza e i gold standard per i disegni degli studi scientifici Riconoscere i principali bias di uno studio medico-scientifico Sapere interpretare i dati riportati in uno studio Rapportare correttamente il proprio paziente alla popolazione analizzata nello studio per ponderare adeguatamente le conclusioni Informare sempre il proprio paziente sulle evidenze scientifiche disponibili riferite alla sua condizione patologica Cercare sempre di adottare un programma di trattamento basato su “prove di efficacia” per il nostro paziente Questi aspetti sono stati e saranno affrontati e approfonditi all’interno degli articoli di questa sezione nei diversi numeri della rivista Il Fisioterapista 1 – Gennaio/Febbraio 2013 BIBLIOGRAFIA 1. GILBERT R, LOGAN S, MOYER VA, ELLIOTT EJ. Assessing diagnostic and screening tests: Part 1. Concepts. West J Med 2001; 174(6): 405-9. 2. AKOBENG AK. Understanding diagnostic tests 1: sensitivity, specificity and predictive values. Acta Paediatr 2007; 96(3):338-41. 3. SACKETT DL, STRAUSS SE, RICHARDSON WS, ROSENBERG W, HAYNES RB. Evi- dence-based medicine: how to practice and teach EBM. London: Churchill-Livingstone, 2000. 4. ALTMAN DG, BLAND JM. Diagnostic tests 2: Predictive values. BMJ 1994; 309(6947):102. 5. LANG TA, SECIC M. How to report statistics in medicine: annotated guidelines for authors, editors, and reviewers. Philadelphia: American College of Physicians, 1997. 6. ESPALLARDO NL. Decisions on diagnosis in family practice: use of sensitivity, specificity, predictive values and likelihood ratios. Asia Pacific Family Medicine 2003; 2: 229-32. 7. JAESCHEKE R, GUYATT G, LIJMER J. Diagnostic tests. In: GUYATT G, RENNIE D, editors. Users’ guides to the medical literature. Chicago AMA Press 2002:121-40. Ulteriori approfondimenti sono disponibili in www.ilfisioterapista.it 76 37-84_Guide.indd 76 01/02/13 17:05