Questa è la formula di un corpo standard, cioè di un test di riferimento, il test ideale: applicando il test diagnostico su cento sani io mi aspetto che ci sia il cento per cento di negatività. Applicando lo stesso test a cento malati mi aspetto che ci sia il cento per cento di positività. Quello è Gold standard; poi nella pratica succede tutto il contrario: succede che io mi ritrovo ad avere una percentuale di errore, di falsi positivi e di falsi negativi. Questa tabella mi fa vedere che A sono tutti i malati positivi al test, mentre B indica tutti i sani risultati negativi al test. A e B sono rispettivamente tutti i malati e tutti i sani. Se andate a vedere qua, qua ci sono tutti i falsi negativi e falsi positivi. E sotto andate a vedere la didascalia ecco perché negli esempi voi troverete molto spesso la lettera seguita dalla percentuale, per memorizzare meglio più che altro. Sensibilità è uno spaccato della tabella. Sensibilità per riga(?)= A/ A + C Poi basta cambiare l’ordine della tabella e si rovescia per la specificità. Se io ho portato la tabella mettendoci il risultato del test nelle righe la formula va bene. Non va bene questa formula quando inverto e porto il risultato del test nelle colonne. Non c’è una regola fissa. È a mia discrezione. Nella specificità D / D+ B (per colonne!) Sensibilità e specificità si ragiona per COLONNE! Per le righe invece mi vado a fare A/ la sommatoria. Il valore predittivo è la percentuale di soggetti che risultano positivi. La stessa cosa qua: C / C + D il valore predittivo negativo. Poi io posso ricavarmi la sensibilità o il contrario, sono formule che poi si possono scambiare. Facciamo un esempio: immaginiamo di applicare un test diagnostico a 20000 donne che partecipano a un programma di screening per la diagnosi precoce del tumore della mammella . Di queste 20000, 646 risultano positive al test. Nella tabella nelle righe ho posizionato il risultato del test, nelle colonne la malattia. 646 è tutto positivo e vengono sottoposte a un approfondimento diagnostico, che rileva la presenza del tumore in 132 soggetti. Dopo questo approfondimento (biopsia) 132 risultano malate,con tumore. A 93 delle donne risultate negative al test viene diagnosticata la malattia successivamente. 93 negative al test che poi hanno la malattia sono falsi negativi, quindi sono positivi. Se questa situazione si presentasse ad un anatomopatologo lui desidererebbe che sia più bassa possibile questa percentuale, perché più alta è più ci scappa l’errore. Voglio andare a vedere quanto è sensibile e quanto è attendibile in termini di specificità questo test. Mi vado a completare la tabella. Il totale mi deve fare ottenere i sani che sono risultati positivi al test (si presuppone che siano percentuali più basse). La stessa cosa per i sani negativi: dovrebbero essere 100 se fosse ideale il test, ma siccome c’è una certa percentuale di errore sarà un numero più o meno piccolo. Questa tabella che viene fuori è il risultato che si calcola per differenza, dopo avere fatto questo primo esame di screening. Dopo avere fatto degli accertamenti successivamente viene fuori che alcuni avevano la malattia e altri no! Di quelli falsi positivi poi avevano la malattia ecc.. Vado a quantificare quanto è attendibile il test. L’attendibilità comprende sensibilità e specificità. 132 / 225 rappresentano la percentuale di soggetti malati positivi al test diviso tutti i malati (positivi e negativi). Il risultato è 58 %. La specificità si calcola sui sani, nell’altra colonna. Negativi sani 19261/ tutti i sani positivi e negativi, ovvero 19771. Il risultato è 97 %. Questo test è molto più specifico che sensibile. Voglio andare poi a vedere anche qual è l’altra predittività dei valori positivi e dei valori negativi. Il calcolo lo faccio per le righe, come l’incidenza, che mi serviva per calcolare il rischio. 132 malati / 647 (malati e sani). Predittività dei valori positivi 20 %. Per i veri negativi (i sani) 99% : è più predittivo per i soggetti sani. Io posso prevedere quello che mi aspetto che sia. Basta fare un primo esame di screening: da quello che viene fuori mi vado a fare l’approfondimento e rivaluto quelli che sono sani (falsi negativi?) o il contrario. Sensibilità e specifità sono 94 % e 89 % in questo caso rispettivamente. Io posso calcolare il valore predittivo positivo e negativo. Se io ho un test con una performance buona, vale a dire se io ho un’alta sensibilità e alta specificità quale scelgo? Quello meno invasivo per il paziente anche se quello meno pericoloso dà un’alta probabilità di insuccessi. Quindi questo percorso statistico porta il medico a preferire un test piuttosto che un altro. Questa è la solita tabella che abbiamo visto 2 x 2 che rappresenta il gold standard cioè quello ideale. Il gold standard dovrebbe dare 100 % sensibilità e 100% di specificità. La sensibilità dove si calcola? Sulla tabella dei malati, posto che il risultato del test sia nelle righe e la patologia nelle colonne. La specificità si calcola sui sani. Dai valori predittivi posso anche calcolare in maniera indiretta qual è la specificità. Specificità : 1 meno la sensibilità. I falsi positivi: 1 meno la specificità.. tutti valori in percentuale. Il medico deve stabilire con ragionevole certezza la presenza o assenza della patologia, ovvero qual è la probabilità che la malattia si presenti se il test è positivo o che sia assente se il test è negativo. Che grafico è questo? A scatola. Non è poprio un istogramma che è un grafico di frequenza classico. È sempre un grafico di frequenza ma non è classico. Come si fa questo grafico? Come si calcola la frequenza? Con la mediana. La mediana sta al centro, dentro la scatola. Poi devo calcolare anche il valore che qua corrisponde al 25 % dell’osservazione?!. Indicatori descrittivi di posizione… Gli INDICATORI DI RISCHIO sono argomenti che hanno a che fare con l’epidemiologia, in altre parole sono modelli statistici incrementati nell’epidemiologia tramite tutto un discorso logico-matematico. Gli indicatori di rischio, intesi come indicatori statistici-decrittivi di rischio (ci sono anche gli indicatori di associazione, fra i quali non c’è soltato la famiglia dei rischi ma ci sono anche dei veri test di correlazione, i test di correlazione che abbiamo affrontato l’altra volta altro non sono che indicatori di associazione). Noi che facciamo con i test di associazione? Associamo due variabili. In questo caso invece noi andiamo a studiare e ad applicare questi modelli perché andiamo a valutare quella che è l’incidenza, la prevalenza della malattia sul territorio. Il rischio relativo cos’è? Altro non è che “il rapporto di due rapporti” dove al nominatore ci sarà l’incidenza degli esposti e al denominatore ci sarà il secondo rapporto, l’incidenza dei non esposti. Questo presuppone l’esigenza di andare a mettere i nostri risultati in una tabella a due vie,dove nelle righe andremo a mettere il FATTORE DI ESPOSIZIONE e nelle colonne andremo a mettere l’ OUTCOME (?) cioè la malattia. Quindi sono variabili di tipo dicotomico. Non è obbligatorio andare a mettere il fattore di esposizione, l’importante è che quando vado a scrivere la formula devo girare (?). Quindi per RISCHIO RELATIVO si intende il rapporto tra le due incidenze e vi porta a calcolare l’incidenza dei due esposti. Come si calcola? Facendo la percentuale dei soggetti malati che sono stati esposti al fattore di esposizione fratto il totale. La stessa cosa dicasi per il rigo di sotto, quindi per i soggetti non esposti al fattore. Quindi è un risultato in termini percentuali, noi abbiamo una frequenza assoluta e poi matematicamente sposto la virgola e….Il rapporto dei due rapporti, quindi il rapporto delle due incidenze, mi darà quella grandezza che è il rischio relativo. Pertanto io devo fare una conta, vado a contare nella mia popolazione campionaria quelli che sono esposti e quelli che non sono esposti, vado a mettere questi dati nelle tabelle e poi mi ritroverò un valore di rischio che può essere maggiore di uno, minore di uno o uguale a zero (quindi nullo). E’ chiaro che devo poter interpretare al meglio il mio risultato numerico: immaginiamo di avere una coorte di soggetti esposti al fumo e mi interessa sapere come incide la patologia in relazione a questo fattore di esposizione (in pratica andiamo a vedere se il fumo aumenta o no l’incidenza della malata). Andiamo a fare il calcolo come abbiamo visto prima e se esce fuori che R è maggiore di 1 significa che i soggetti che fumano presentano una, due,tre volte le possibilità in più di beccarsi l’asma rispetto a un non esposto. Se invece il risultato è negativo significa che quel fattore non è di esposizione, bensì un FATTORE DI PROTEZIONE. Altro indicatore che si usa moltissimo con le frequenze è l’OCS (da verificare), questo di usa molto nelle corse dei cavalli. Questo indicatore ci dice qual è il rapporto tra due probabilità, cioè tra la probabilità che un evento avvenga diviso la probabilità che lo stesso evento non avvenga completamente, quindi è sempre un indicatore di rischio. In pratica la formula molto sintetica è il “prodotto del rapporto incrociato” cioè io moltiplico A per B diviso B per C. Quindi se avete presente questa tabella a due vie basta moltiplicare e dividere. Sulla tabella dove noi abbiamo le frequenze, quindi presumibilmente stiamo portando avanti uno studio di coorte e non un caso-controllo, perchè come potete intuire in quest’ultimo caso io vado a correlare i casi con i controlli. Quindi questo calcolo si applica in altri studi come quelli coorte. Quindi se io ho uno studio di questo genere e introduco un fattore di esposizione comunque mi ritrovo delle frequenze e quindi una tabella di contingenza. Cosa posso fare io? Due tipi di calcolo: o andiamo a vedere se le due variabili sono dipendenti o meno oppure applicare tutti i rischi, se voglio andare a quantificare l’entità del fattore di esposizione e quindi quanto esso incide devo applicare tutti i rischi. Adesso introduciamo una cosa nuova: il TEOREMA DI BAYES. Esso è la premessa per un altro tipo di calcolo, si rifà al concetto di probabilità statistica. Allora immaginiamo di partire da questa distribuzione grafica dove sono accumulati i soggetti sani, cioè identificati come assenza di malattia. È chiaro che poi ammettendo che tutti e 100 (ammettendo che siano 100) siano sani, io posso cadere in errore: l’errore quale sarà? L’errore va a cadere in una piccola area critica. L’area critica è l’area dove presumibilmente io vado a commettere un errore, quella in cui ci saranno i così detti falsi positivi. Quali sono i falsi positivi? Sono i soggetti negativi! Cioè i soggetti sani. Infatti in tutta la curva che rappresenta i soggetti sani ci sarà un margine di errore, in cui cadranno i soggetti non proprio del tutto sani, dove per sani io intendo i veri negativi. Se vogliamo codificare i sani come negativi (quindi come quelli che non hanno la malattia) e i malati come positivi (quindi come quelli che la malattia invece ce l’hanno) io nell’andare a calcolare mi ritroverò una certa percentuale di falsi positivi, che in realtà la malattia non ce l’hanno. Noi osservando questo grafico vediamo e sappiamo che in questa curva sono tutti sani e in questa vi sono tutti i malati. Però anche nella curva dei veri positivi ci può scappare una certa percentuale di soggetti che può cadere nella zona critica. Il grafico monta le due curve: ne monta una e l’altra la mette sottosopra, però voi immaginate di averle separate. Di conseguenza i sani sono i veri negativi, i falsi positivi sono sani, i veri positivi sono quelli malati. Quindi in pratica il teorema di Bayes è una formula che rappresenta un rapporto. In questo rapporto noi metteremo al numeratore i veri positivi, cioè i malati, al denominatore andremo a mettere sia i veri positivi che i falsi positivi, tutti. Questa formula trova spiegazione in questo esempio: immaginiamo di dover fare diagnosi prenatale di beta-talassemia. Come si fa diagnosi prenatale? Andando a vedere la sintesi delle catene dell’emoglobina su sangue fetale. Si fa un prelievo di sangue fetale e si va a vedere come avviene la sintesi delle catene dell’emoglobina che poi ci daranno la possibilità di fare diagnosi. Che succede? Io devo andare a contare questi soggetti: se il mio campione è di 239, ci saranno 55 soggetti che sono omozigoti positivi al test, 1 positivo ma non omozigote, 2 negativi omozigoti e 181 sono eterozigoti negativi al test. In questo caso qual è il fattore di esposizione? L’essere o no omozigote! Perché si presuppone che una di queste condizioni sia quella che poi mi farà aumentate l’incidenza della beta talassemia! Quindi il discorso è sempre quello. Qui la colonna è stata invertita, vedete che il fattore di esposizione è stato contato nelle colonne, non cambia nulla, basta invertire la formula, il rapporto. Quindi questo è il fattore di esposizione, qua invece metto l’OUTCAM, quale sarà? Ci saranno soggetti più esposti, quindi omozigoti, e soggetti non esposti, quindi eterozigoti. Applico il test e su 239 otterrò questa frequenza. Se vi ricordate questo calcolo dove ce lo siamo ritrovato? Quando si applicava il quadrato, quando si applicava il calcolo di incidenza per ricavarci il rischio. Utilizzando la stessa tabella, se noi abbiamo un (?) di esposizione e un OUTCOME noi ci ritroviamo a fare un’altra tipologia di calcolo. A che cosa serve sapere tutto questo, cioè il rapporto dei positivi per i positivi più il totale? Ci serve per sapere ricavare una informazione quando andiamo al applicare un test diagnostico. Esempio per tutti: immaginate di andare a comprare un test per il sangue occulto in farmacia, sapendo qual è il limite di quel prodotto, che avrà un margine di errore del 3,4%, che significa? Che se io quel test lo applico su 100 pazienti sani devo aspettarmi che siano 100 negativi, ma non è così. Allo stesso modo se io applico un test di gravidanza a 100 donne gravide mi aspetto 100 positivi, invece non è così, ci sarà sempre un margine di errore in cui potrò beccare 2-3 donne non gravide, cioè false positive. Quindi il tutto ruota attorno a questo teorema di Bayes. Quindi vado ad applicare una formula che mi consente di capire quanto è attendibile quel test che ho comprato. Già la casa mi dice che se io utilizzo il prodotto in un certo modo e senza farlo scadere ci sarà un 2-3% di errore. Quindi per andare a migliorare questo test diagnostico (che non è un test statistico) devo andare a vedere quanto questo test è performante. Per fare ciò utilizzo due criteri: quanto è sensibile percentualmente e quanto è specifico percentualmente. Allora la sensibilità noi la calcoliamo in questo caso facendo il totale, quindi la percentuale di soggetti positivi omozigoti diviso tutti gli omozigoti, a prescindere dal fatto che siano omozigoti o eterozigoti. Questo mi dice che ottengo un valore del 96% che è la percentuale di sensibilità. Invece per la specificità devo andare a prendere i soggetti negativi eterozigoti diviso tutti gli eterozigoti, a prescindere che siano negativi o positivi. 181:182 farà 0,99 (si sposta la virgola, 99). Quindi noi ci ritroviamo una sensibilità del 96% e una specificità più elevata, del 99%. Quindi sensibilità e specificità sono due requisiti non esclusivi che io devo andare a giostrare in moda da avere un test il più performante possibile. Io devo decidere cosa mi interessa, che il test sia più sensibile o più specifico? Questo perché? Perché se io aumento la sensibilità mi ritroverò una specificità bassa, o il contrario. Quindi cosa mi interessa sapere? Che il test che utilizzo mi dia una bassa percentuale di falsi positivi o falsi negativi. Immaginiamo che ci sia un anatomopatologo che ha una carrellata di vetrini da leggere dai quali emergerà una diagnosi, tumore o sospetto tumore. Ovviamente ci saranno dei casi in cui ha dei dubbi, quindi alla fine di tutta questa carrellata di vetrini il medico ha interesse che il margine di errore sia relativo ai falsi positivi perchè se becca molti falsi positivi significa che sono quelli che probabilmente potrebbero avere la malattia ma che in effetti sono normali, e non il contrario! Preferirebbe quindi che quelli malati diano il 100% di positività e i sani il 100% di negatività, questo in teoria me nella pratica a lui interessa che vi sia la percentuale più bassa possibile di quale errore? Dei falsi positivi! Quindi dipende dall’obiettivo che ci si propone per applicare quel test. Posto che non c’è mai la possibilità di avere un 100% di positività o negatività bisogna quindi andare a giocare sul margine di errore in funzione dell’obiettivo che si vuole raggiungere, posto che le due caratteristiche che abbiamo detto prima sono quelle che rendono performante il test. Altro calcolo che io mi vado a sviluppare sono altre due formule, una è la percentuale di veri positivi, come me la calcolo? Facendo i positivi omozigoti, 55, diviso TUTTI i positivi a prescindere che siano omozigoti o eterozigoti, cioè 56, ottengo in questo caso 98%. Ok? (Cosa da non confondere è lo SCREENING, è un concetto diverso dal test diagnostico, viene applicato su grandi masse, come la vaccinazione antinfluenzale). Vediamo un altro esempio, come una comparazione tra due metodologie diverse, come la TAC e l’angiografia: qual è la migliore? Basta applicare questo concetto per capire quale sia la più attendibile, dipende proprio da qual è il mio obiettivo, cioè se voglio un test che sia molto specifico e poco sensibile o il contrario.