Questa è la formula di un corpo standard, cioè di un test di

annuncio pubblicitario
Questa è la formula di un corpo standard, cioè di un test di riferimento, il test ideale: applicando il test
diagnostico su cento sani io mi aspetto che ci sia il cento per cento di negatività. Applicando lo stesso test a
cento malati mi aspetto che ci sia il cento per cento di positività. Quello è Gold standard; poi nella pratica
succede tutto il contrario: succede che io mi ritrovo ad avere una percentuale di errore, di falsi positivi e di
falsi negativi.
Questa tabella mi fa vedere che A sono tutti i malati positivi al test, mentre B indica tutti i sani risultati
negativi al test.
A e B sono rispettivamente tutti i malati e tutti i sani. Se andate a vedere qua, qua ci sono tutti i falsi
negativi e falsi positivi. E sotto andate a vedere la didascalia ecco perché negli esempi voi troverete molto
spesso la lettera seguita dalla percentuale, per memorizzare meglio più che altro.
Sensibilità è uno spaccato della tabella.
Sensibilità per riga(?)= A/ A + C
Poi basta cambiare l’ordine della tabella e si rovescia per la specificità.
Se io ho portato la tabella mettendoci il risultato del test nelle righe la formula va bene. Non va bene
questa formula quando inverto e porto il risultato del test nelle colonne. Non c’è una regola fissa. È a mia
discrezione.
Nella specificità D / D+ B (per colonne!)
Sensibilità e specificità si ragiona per COLONNE!
Per le righe invece mi vado a fare A/ la sommatoria. Il valore predittivo è la percentuale di soggetti che
risultano positivi. La stessa cosa qua: C / C + D il valore predittivo negativo. Poi io posso ricavarmi la
sensibilità o il contrario, sono formule che poi si possono scambiare.
Facciamo un esempio: immaginiamo di applicare un test diagnostico a 20000 donne che partecipano a un
programma di screening per la diagnosi precoce del tumore della mammella . Di queste 20000, 646
risultano positive al test. Nella tabella nelle righe ho posizionato il risultato del test, nelle colonne la
malattia. 646 è tutto positivo e vengono sottoposte a un approfondimento diagnostico, che rileva la
presenza del tumore in 132 soggetti. Dopo questo approfondimento (biopsia) 132 risultano malate,con
tumore.
A 93 delle donne risultate negative al test viene diagnosticata la malattia successivamente. 93 negative al
test che poi hanno la malattia sono falsi negativi, quindi sono positivi. Se questa situazione si presentasse
ad un anatomopatologo lui desidererebbe che sia più bassa possibile questa percentuale, perché più alta è
più ci scappa l’errore.
Voglio andare a vedere quanto è sensibile e quanto è attendibile in termini di specificità questo test. Mi
vado a completare la tabella. Il totale mi deve fare ottenere i sani che sono risultati positivi al test (si
presuppone che siano percentuali più basse). La stessa cosa per i sani negativi: dovrebbero essere 100 se
fosse ideale il test, ma siccome c’è una certa percentuale di errore sarà un numero più o meno piccolo.
Questa tabella che viene fuori è il risultato che si calcola per differenza, dopo avere fatto questo primo
esame di screening. Dopo avere fatto degli accertamenti successivamente viene fuori che alcuni avevano la
malattia e altri no! Di quelli falsi positivi poi avevano la malattia ecc..
Vado a quantificare quanto è attendibile il test. L’attendibilità comprende sensibilità e specificità. 132 / 225
rappresentano la percentuale di soggetti malati positivi al test diviso tutti i malati (positivi e negativi). Il
risultato è 58 %.
La specificità si calcola sui sani, nell’altra colonna. Negativi sani 19261/ tutti i sani positivi e negativi, ovvero
19771.
Il risultato è 97 %. Questo test è molto più specifico che sensibile.
Voglio andare poi a vedere anche qual è l’altra predittività dei valori positivi e dei valori negativi. Il calcolo
lo faccio per le righe, come l’incidenza, che mi serviva per calcolare il rischio. 132 malati / 647 (malati e
sani). Predittività dei valori positivi 20 %. Per i veri negativi (i sani) 99% : è più predittivo per i soggetti sani.
Io posso prevedere quello che mi aspetto che sia. Basta fare un primo esame di screening: da quello che
viene fuori mi vado a fare l’approfondimento e rivaluto quelli che sono sani (falsi negativi?) o il contrario.
Sensibilità e specifità sono 94 % e 89 % in questo caso rispettivamente.
Io posso calcolare il valore predittivo positivo e negativo.
Se io ho un test con una performance buona, vale a dire se io ho un’alta sensibilità e alta specificità quale
scelgo? Quello meno invasivo per il paziente anche se quello meno pericoloso dà un’alta probabilità di
insuccessi. Quindi questo percorso statistico porta il medico a preferire un test piuttosto che un altro.
Questa è la solita tabella che abbiamo visto 2 x 2 che rappresenta il gold standard cioè quello ideale.
Il gold standard dovrebbe dare 100 % sensibilità e 100% di specificità. La sensibilità dove si
calcola? Sulla tabella dei malati, posto che il risultato del test sia nelle righe e la patologia nelle
colonne. La specificità si calcola sui sani.
Dai valori predittivi posso anche calcolare in maniera indiretta qual è la specificità. Specificità : 1 meno la
sensibilità. I falsi positivi: 1 meno la specificità.. tutti valori in percentuale.
Il medico deve stabilire con ragionevole certezza la presenza o assenza della patologia, ovvero qual è la
probabilità che la malattia si presenti se il test è positivo o che sia assente se il test è negativo.
Che grafico è questo? A scatola. Non è poprio un istogramma che è un grafico di frequenza classico. È
sempre un grafico di frequenza ma non è classico.
Come si fa questo grafico? Come si calcola la frequenza? Con la mediana. La mediana sta al centro, dentro
la scatola. Poi devo calcolare anche il valore che qua corrisponde al 25 % dell’osservazione?!. Indicatori
descrittivi di posizione…
Gli INDICATORI DI RISCHIO sono argomenti che hanno a che fare con l’epidemiologia, in altre parole sono
modelli statistici incrementati nell’epidemiologia tramite tutto un discorso logico-matematico. Gli indicatori
di rischio, intesi come indicatori statistici-decrittivi di rischio (ci sono anche gli indicatori di associazione, fra
i quali non c’è soltato la famiglia dei rischi ma ci sono anche dei veri test di correlazione, i test di
correlazione che abbiamo affrontato l’altra volta altro non sono che indicatori di associazione). Noi che
facciamo con i test di associazione? Associamo due variabili. In questo caso invece noi andiamo a studiare e
ad applicare questi modelli perché andiamo a valutare quella che è l’incidenza, la prevalenza della malattia
sul territorio. Il rischio relativo cos’è? Altro non è che “il rapporto di due rapporti” dove al nominatore ci
sarà l’incidenza degli esposti e al denominatore ci sarà il secondo rapporto, l’incidenza dei non esposti.
Questo presuppone l’esigenza di andare a mettere i nostri risultati in una tabella a due vie,dove nelle righe
andremo a mettere il FATTORE DI ESPOSIZIONE e nelle colonne andremo a mettere l’ OUTCOME (?) cioè la
malattia. Quindi sono variabili di tipo dicotomico. Non è obbligatorio andare a mettere il fattore di
esposizione, l’importante è che quando vado a scrivere la formula devo girare (?).
Quindi per RISCHIO RELATIVO si intende il rapporto tra le due incidenze e vi porta a calcolare l’incidenza dei
due esposti. Come si calcola? Facendo la percentuale dei soggetti malati che sono stati esposti al fattore di
esposizione fratto il totale. La stessa cosa dicasi per il rigo di sotto, quindi per i soggetti non esposti al
fattore. Quindi è un risultato in termini percentuali, noi abbiamo una frequenza assoluta e poi
matematicamente sposto la virgola e….Il rapporto dei due rapporti, quindi il rapporto delle due incidenze,
mi darà quella grandezza che è il rischio relativo. Pertanto io devo fare una conta, vado a contare nella mia
popolazione campionaria quelli che sono esposti e quelli che non sono esposti, vado a mettere questi dati
nelle tabelle e poi mi ritroverò un valore di rischio che può essere maggiore di uno, minore di uno o uguale
a zero (quindi nullo). E’ chiaro che devo poter interpretare al meglio il mio risultato numerico:
immaginiamo di avere una coorte di soggetti esposti al fumo e mi interessa sapere come incide la patologia
in relazione a questo fattore di esposizione (in pratica andiamo a vedere se il fumo aumenta o no
l’incidenza della malata). Andiamo a fare il calcolo come abbiamo visto prima e se esce fuori che R è
maggiore di 1 significa che i soggetti che fumano presentano una, due,tre volte le possibilità in più di
beccarsi l’asma rispetto a un non esposto. Se invece il risultato è negativo significa che quel fattore non è di
esposizione, bensì un FATTORE DI PROTEZIONE.
Altro indicatore che si usa moltissimo con le frequenze è l’OCS (da verificare), questo di usa molto nelle
corse dei cavalli. Questo indicatore ci dice qual è il rapporto tra due probabilità, cioè tra la probabilità che
un evento avvenga diviso la probabilità che lo stesso evento non avvenga completamente, quindi è sempre
un indicatore di rischio. In pratica la formula molto sintetica è il “prodotto del rapporto incrociato” cioè io
moltiplico A per B diviso B per C. Quindi se avete presente questa tabella a due vie basta moltiplicare e
dividere.
Sulla tabella dove noi abbiamo le frequenze, quindi presumibilmente stiamo portando avanti uno studio di
coorte e non un caso-controllo, perchè come potete intuire in quest’ultimo caso io vado a correlare i casi
con i controlli. Quindi questo calcolo si applica in altri studi come quelli coorte. Quindi se io ho uno studio di
questo genere e introduco un fattore di esposizione comunque mi ritrovo delle frequenze e quindi una
tabella di contingenza. Cosa posso fare io? Due tipi di calcolo: o andiamo a vedere se le due variabili sono
dipendenti o meno oppure applicare tutti i rischi, se voglio andare a quantificare l’entità del fattore di
esposizione e quindi quanto esso incide devo applicare tutti i rischi.
Adesso introduciamo una cosa nuova: il TEOREMA DI BAYES. Esso è la premessa per un altro tipo di calcolo,
si rifà al concetto di probabilità statistica. Allora immaginiamo di partire da questa distribuzione grafica
dove sono accumulati i soggetti sani, cioè identificati come assenza di malattia. È chiaro che poi
ammettendo che tutti e 100 (ammettendo che siano 100) siano sani, io posso cadere in errore: l’errore
quale sarà? L’errore va a cadere in una piccola area critica. L’area critica è l’area dove presumibilmente io
vado a commettere un errore, quella in cui ci saranno i così detti falsi positivi. Quali sono i falsi positivi?
Sono i soggetti negativi! Cioè i soggetti sani. Infatti in tutta la curva che rappresenta i soggetti sani ci sarà
un margine di errore, in cui cadranno i soggetti non proprio del tutto sani, dove per sani io intendo i veri
negativi. Se vogliamo codificare i sani come negativi (quindi come quelli che non hanno la malattia) e i
malati come positivi (quindi come quelli che la malattia invece ce l’hanno) io nell’andare a calcolare mi
ritroverò una certa percentuale di falsi positivi, che in realtà la malattia non ce l’hanno. Noi osservando
questo grafico vediamo e sappiamo che in questa curva sono tutti sani e in questa vi sono tutti i malati.
Però anche nella curva dei veri positivi ci può scappare una certa percentuale di soggetti che può cadere
nella zona critica. Il grafico monta le due curve: ne monta una e l’altra la mette sottosopra, però voi
immaginate di averle separate. Di conseguenza i sani sono i veri negativi, i falsi positivi sono sani, i veri
positivi sono quelli malati.
Quindi in pratica il teorema di Bayes è una formula che rappresenta un rapporto. In questo rapporto noi
metteremo al numeratore i veri positivi, cioè i malati, al denominatore andremo a mettere sia i veri positivi
che i falsi positivi, tutti.
Questa formula trova spiegazione in questo esempio: immaginiamo di dover fare diagnosi prenatale di
beta-talassemia. Come si fa diagnosi prenatale? Andando a vedere la sintesi delle catene dell’emoglobina
su sangue fetale. Si fa un prelievo di sangue fetale e si va a vedere come avviene la sintesi delle catene
dell’emoglobina che poi ci daranno la possibilità di fare diagnosi. Che succede? Io devo andare a contare
questi soggetti: se il mio campione è di 239, ci saranno 55 soggetti che sono omozigoti positivi al test, 1
positivo ma non omozigote, 2 negativi omozigoti e 181 sono eterozigoti negativi al test. In questo caso qual
è il fattore di esposizione? L’essere o no omozigote! Perché si presuppone che una di queste condizioni sia
quella che poi mi farà aumentate l’incidenza della beta talassemia! Quindi il discorso è sempre quello.
Qui la colonna è stata invertita, vedete che il fattore di esposizione è stato contato nelle colonne, non
cambia nulla, basta invertire la formula, il rapporto. Quindi questo è il fattore di esposizione, qua invece
metto l’OUTCAM, quale sarà? Ci saranno soggetti più esposti, quindi omozigoti, e soggetti non esposti,
quindi eterozigoti. Applico il test e su 239 otterrò questa frequenza. Se vi ricordate questo calcolo dove ce
lo siamo ritrovato? Quando si applicava il quadrato, quando si applicava il calcolo di incidenza per ricavarci
il rischio. Utilizzando la stessa tabella, se noi abbiamo un (?) di esposizione e un OUTCOME noi ci ritroviamo
a fare un’altra tipologia di calcolo. A che cosa serve sapere tutto questo, cioè il rapporto dei positivi per i
positivi più il totale? Ci serve per sapere ricavare una informazione quando andiamo al applicare un test
diagnostico. Esempio per tutti: immaginate di andare a comprare un test per il sangue occulto in farmacia,
sapendo qual è il limite di quel prodotto, che avrà un margine di errore del 3,4%, che significa? Che se io
quel test lo applico su 100 pazienti sani devo aspettarmi che siano 100 negativi, ma non è così. Allo stesso
modo se io applico un test di gravidanza a 100 donne gravide mi aspetto 100 positivi, invece non è così, ci
sarà sempre un margine di errore in cui potrò beccare 2-3 donne non gravide, cioè false positive. Quindi il
tutto ruota attorno a questo teorema di Bayes. Quindi vado ad applicare una formula che mi consente di
capire quanto è attendibile quel test che ho comprato. Già la casa mi dice che se io utilizzo il prodotto in un
certo modo e senza farlo scadere ci sarà un 2-3% di errore. Quindi per andare a migliorare questo test
diagnostico (che non è un test statistico) devo andare a vedere quanto questo test è performante. Per fare
ciò utilizzo due criteri: quanto è sensibile percentualmente e quanto è specifico percentualmente. Allora la
sensibilità noi la calcoliamo in questo caso facendo il totale, quindi la percentuale di soggetti positivi
omozigoti diviso tutti gli omozigoti, a prescindere dal fatto che siano omozigoti o eterozigoti. Questo mi
dice che ottengo un valore del 96% che è la percentuale di sensibilità. Invece per la specificità devo andare
a prendere i soggetti negativi eterozigoti diviso tutti gli eterozigoti, a prescindere che siano negativi o
positivi. 181:182 farà 0,99 (si sposta la virgola, 99). Quindi noi ci ritroviamo una sensibilità del 96% e una
specificità più elevata, del 99%. Quindi sensibilità e specificità sono due requisiti non esclusivi che io devo
andare a giostrare in moda da avere un test il più performante possibile. Io devo decidere cosa mi
interessa, che il test sia più sensibile o più specifico? Questo perché? Perché se io aumento la sensibilità mi
ritroverò una specificità bassa, o il contrario. Quindi cosa mi interessa sapere? Che il test che utilizzo mi dia
una bassa percentuale di falsi positivi o falsi negativi. Immaginiamo che ci sia un anatomopatologo che ha
una carrellata di vetrini da leggere dai quali emergerà una diagnosi, tumore o sospetto tumore. Ovviamente
ci saranno dei casi in cui ha dei dubbi, quindi alla fine di tutta questa carrellata di vetrini il medico ha
interesse che il margine di errore sia relativo ai falsi positivi perchè se becca molti falsi positivi significa che
sono quelli che probabilmente potrebbero avere la malattia ma che in effetti sono normali, e non il
contrario! Preferirebbe quindi che quelli malati diano il 100% di positività e i sani il 100% di negatività,
questo in teoria me nella pratica a lui interessa che vi sia la percentuale più bassa possibile di quale errore?
Dei falsi positivi! Quindi dipende dall’obiettivo che ci si propone per applicare quel test. Posto che non c’è
mai la possibilità di avere un 100% di positività o negatività bisogna quindi andare a giocare sul margine di
errore in funzione dell’obiettivo che si vuole raggiungere, posto che le due caratteristiche che abbiamo
detto prima sono quelle che rendono performante il test.
Altro calcolo che io mi vado a sviluppare sono altre due formule, una è la percentuale di veri positivi, come
me la calcolo? Facendo i positivi omozigoti, 55, diviso TUTTI i positivi a prescindere che siano omozigoti o
eterozigoti, cioè 56, ottengo in questo caso 98%. Ok? (Cosa da non confondere è lo SCREENING, è un
concetto diverso dal test diagnostico, viene applicato su grandi masse, come la vaccinazione
antinfluenzale). Vediamo un altro esempio, come una comparazione tra due metodologie diverse, come la
TAC e l’angiografia: qual è la migliore? Basta applicare questo concetto per capire quale sia la più
attendibile, dipende proprio da qual è il mio obiettivo, cioè se voglio un test che sia molto specifico e poco
sensibile o il contrario.
Scarica