Titolo/Title Guida allʼesecuzione di prove con risultati qualitativi Guide to perform tests with qualitative results Sigla/Reference DT-07-DL/DS Revisione/Revision 00 Data/Date 06/02/2013 Redazione Approvazione Autorizzazione allʼemissione Entrata in vigore Il Membro Relatore competente I Direttori di Dipartimento Il Direttore Generale 18-03-2013 Il presente documento è di proprietà di ACCREDIA e non può essere riprodotto o diffuso in parte o per intero, se non dietro autorizzazione scritta del Direttore Generale. DOCUMENTI TECNICI Data: 2013-02-06 DT-07-DL/DS rev. 00 Pag. 1 di 47 Guida all’esecuzione di prove con risultati qualitativi (Misura ciò che è misurabile e rendi misurabile ciò che non lo è - Galileo Galilei) Indice 0. Premessa .............................................................................................................................. 3 1. Introduzione .......................................................................................................................... 5 2. Tabelle di contingenza ......................................................................................................... 6 3. Il teorema di Bayes ............................................................................................................... 8 3.1. MODALITÀ DI COMBINAZIONE DEGLI ESITI DI PROVE SUCCESSIVE ................................... 12 3.2. VALUTAZIONE DELLE PROBABILITÀ DI RISPOSTE FALSE ................................................... 15 3.2.1 Valutazione a partire dalla distribuzione nota delle risposte...................................... 15 3.2.2 Valutazione a partire dalla esecuzione di una lunga serie di misurazioni ................. 20 3.3. APPLICAZIONI DEL TEOREMA DI BAYES ............................................................................ 21 3.4. CONCLUSIONI PER IL TEOREMA DI BAYES ........................................................................ 22 4. Metodo degli intervalli statistici ........................................................................................ 25 5. Le curve di potenza ............................................................................................................ 28 6. Conclusioni ......................................................................................................................... 30 Appendice A. Indicazioni pratiche - CLSI EP12 e MEQUALAN .......................................... 31 A.1. VARIABILITÀ DEI RISULTATI QUALITATIVI. CLSI EP12 E MEQUALAN ............................... 31 A.1.1 CLSI-EP12 - Evaluation of Qualitative Test Performance......................................... 31 A.1.2 Progetto MEQUALAN .............................................................................................. 33 A.2 CASI D'USO ........................................................................................................................ 35 A.3. CONCLUSIONI.................................................................................................................... 38 Appendice B. Definizioni da CLSI EP12-A2 (2007) e documento Accredia RT08_rev02 (11-09-2012) ........................................................................................................ 39 Appendice C. Bibliografia di riferimento .............................................................................. 44 DOCUMENTI TECNICI Data: 2013-02-06 DT-07-DL/DS rev. 00 Pag. 2 di 47 0. Premessa I requisiti generali per l'accreditamento dei laboratori di prova (UNI EN ISO 17025) e quelli particolari per i laboratori medici (UNI ISO 15189) fanno più volte riferimento alla incertezza dei risultati dei metodi di prova ISO 17025 5.4.5.1 “stima dell’incertezza dei risultati” ISO 15189 3.19 “parameter, associated with the result of a measurement ” Inoltre, sia ISO 17025 che ISO 15189 non fanno alcuna distinzione tra tipologie di metodi per l'applicabilità della stima di incertezza. Tuttavia, gli strumenti concettuali e pratici ad oggi disponibili per incertezza e ripetibilità sono sicuramente riferiti a risultati quantitativi, ossia espressi come valore numerico (valore misurato). Per questi le conoscenze sono consolidate e le tecniche di calcolo robuste e raffinate. Ciò ha indotto più di qualcuno a ritenere che incertezza e ripetibilità siano caratteristiche stimabili solo nel caso di risultati espressi in forma quantitativa. ISO 17025 avverte tuttavia che (Nota 3 al punto 5.4.5.3) “...La validazione è sempre un bilancio fra costi, rischi e possibilità tecniche. Vi sono molti casi in cui la gamma e l’incertezza dei valori (per esempio: l’incertezza, i limiti di rivelazione, la selettività, la linearità, la ripetibilità, la riproducibilità, la robustezza e la sensibilità incrociata alle interferenze) può essere fornita unicamente in modo semplificato a causa di mancanza di informazioni.” Ovvero, è preferibile una stima semplificata, approssimata, persino grossolana, a nessuna stima. La creazione del tutto artificiale di uno spartiacque tra metodi con risultati quantitativi e metodi con risultati qualitativi (relativi a proprietà classificatorie ed ordinali) talvolta induce in errore gli operatori, quando giungono a trascurare la componente quantitativa di metodi a cui si applica una interpretazione qualitativa. I metodi con risultati qualitativi non sono molto numerosi nei laboratori chimici e per la microbiologia ambientale o degli alimenti. Sono invece ben rappresentati nei laboratori tossicologici, forensi, veterinari e soprattutto medici. Il problema della stima delle caratteristiche di questi metodi diventa allora rilevante. DOCUMENTI TECNICI Data: 2011-05-11 DT-?? rev. 00 Pag. 3 di 47 Questa guida è finalizzata ad aiutare i laboratori ed i produttori di sistemi analitici e reagenti ad affrontare la stima dell'incertezza di misura e la gestione della ripetibilità per i metodi che non producono risultati numerici, quantitativi. Vengono innanzitutto ripresi alcuni concetti fondamentali di calcolo delle probabilità (teorema di Bayes). Va sottolineato che questa sezione non é concepita per l'applicazione diretta nei laboratori; non tanto per la complessità apparente (più che reale) delle formule statistiche, quanto per la necessità di disporre in laboratorio di metodi adeguati di comparazione. Nelle appendici vengono invece esposte le linee guida vere e proprie per i laboratori ed i loro fornitori, ispirate soprattutto dal documento CLSI EP12 dedicato specificamente a questo argomento. È necessario anche qui sottolineare che non sempre le istruzioni qui contenute sono applicabili autonomamente dal singolo laboratorio. Anzi, è verosimile che ciò possa avvenire solo in un numero limitato di casi. Quando il laboratorio si avvale di un metodo con risultati qualitativi, infatti, lo fa appunto perché il corrispondente metodo quantitativo non é conveniente o addirittura è impraticabile. Allo stesso modo, non è facile per i laboratori disporre di materiali od oggetti di prova da sottoporre a prova con le caratteristiche adeguate. Ciò invece non si può affermare per i produttori, che hanno già l'obbligo di misurare le prestazioni dei loro metodi per ottenere il marchio CE secondo il D.lgs. 332/2000 e la Direttiva Europea sui dispositivi medico-­‐diagnostici in vitro (IVDD 98/79/EC). L'onere di produrre evidenze sull’incertezza e per la ripetibilità dei metodi, in particolare dei metodi con risultati qualitativi, ai fini dell'accreditamento, ricade quindi sia sui laboratori che sui loro fornitori, in misura sicuramente variabile da caso a caso, ma spesso prevalentemente a carico di questi ultimi. DOCUMENTI TECNICI Data: 2013-02-06 DT-07-DL/DS rev. 00 Pag. 4 di 47 1. Introduzione Le analisi qualitative consistono in un processo di classificazione. Oggetti o materiali di prova vengono assegnati ad una determinata classe sulla base delle risposte ottenute attraverso le prove a cui vengono sottoposti. Per restare nel campo delle analisi ambientali che interessa la maggior parte dei laboratori di prova e/taratura, lʼesempio più semplice che si può fare è la catalogazione di un rifiuto in base alla presenza o alla assenza di un dato contaminante. La classificazione di un oggetto/materiale di prova è così un processo eseguito sulla base di una evidenza (oggettiva) positiva o sulla mancanza di questa evidenza. Unʼerrata classificazione può derivare da una evidenza positiva pur essendo lʼoggetto/materiale di prova collocabile in una classe diversa (errore di primo tipo o falso positivo), oppure una mancanza di evidenza positiva per la classe a cui lʼoggetto/materiale di prova effettivamente appartiene (errore di secondo tipo o falso negativo). Per minimizzare i rischi associati ad unʼerrata classificazione, si deve esercitare particolare cura nella validazione dei metodi analitici impiegati, se questi sono stati messi a punto dal laboratorio, nella verifica periodica e monitoraggio delle prestazioni se tali metodi sono normalizzati o comunque ufficiali (ossia prodotti da autorità riconosciute, ai vari livelli nazionale ed internazionale). Per esempio, se è in gioco la presenza/assenza di una sostanza in un dato oggetto/materiale di prova, sarà importante curare lʼattendibilità del limite di rivelabilità del metodo impiegato per quella sostanza. Come si è accennato, la possibilità di una falsa risposta del metodo è, per sua natura, duplice. Non può, cioè, essere espressa in termini di rischio univoco; né si può attribuire alla decisione, presa in seguito alla/e evidenza/e oggettive disponibili, un unico livello di probabilità. È necessario, quindi, individuare un parametro statistico che tenga conto di entrambi i rischi (di falso positivo e di falso negativo), che sia capace di riflettere il livello di probabilità associato alla decisione presa, che sia in grado di aggiornare il proprio valore sulla base di ulteriori informazioni derivanti dalle risposte dovute allʼapplicazione successiva di altre prove e/o metodi. Altre caratteristiche desiderabili per questo parametro sono quelle derivanti dalla mancanza di ambiguità, dalla facilità di calcolo e di espressione e da una larga convergenza sul relativo utilizzo. Il presente documento non ha la pretesa di trattare tutti i metodi finalizzati alla espressione dellʼincertezza per risultati qualitativi. Nel seguito ne sono presentati quattro, ritenuti tra quelli maggiormente utilizzati: − Tabelle di contingenza; − Teorema di Bayes; − Intervalli statistici; − Curve di prestazione o di potenza. DOCUMENTI TECNICI Data: 2013-02-06 DT-07-DL/DS rev. 00 Pag. 5 di 47 I primi due trattano lʼincertezza come un problema di classificazione mentre la procedura basata sugli intervalli statistici calcola lʼincertezza in modo simile a quello usato nelle analisi quantitative. Infine, il metodo basato sulle curve di prestazione è generalmente applicabile a tutte le prove di screening. Tutte queste metodologie presentano vantaggi e svantaggi e devono essere accuratamente valutati dal laboratorio con particolare riferimento alla caso specifico di relativo utilizzo. 2. Tabelle di contingenza Le tabelle di contingenza trattano le analisi qualitative come un problema di classificazione, per esempio quando i risultati di una prova sono utilizzati per sapere se si trovano sopra o sotto il livello di un valore specifico di riferimento (per esempio, limite di legge). Il risultato quindi può essere positivo (i.e. sopra o uguale al valore di riferimento specificato) o negativo (i.e. sotto il valore di riferimento specificato). Tipicamente si prendono in considerazione solo 2 possibili esiti (p) e due possibili situazioni reali (n) e dunque si può costruire una tabella di contingenza 2x2 (nxp). Le dimensioni della tabella sono ovviamente funzione del numero di categorie attese. ESEMPIO 1 Abbiamo un metodo che permette di rilevare la presenza assenza di aflatossine negli alimenti al livello di 2 µg/g che è il limite legale. Si utilizza un kit commerciale che è basato sul cambiamento di colore quando la concentrazione di aflatossine è superiore al limite legale. Si preparano 300 campioni di cui 150 hanno un livello di aflatossine superiore al limite di legge e 150 un limite inferiore a quello di legge come confermato da una parallela analisi mediante HPLC. Si applica quindi il test. Si possono verificare 4 casi: - una risposta negativa del test che conferma quella reale; - una risposta positiva del test che conferma quella reale; - una risposta positiva del test in disaccordo con quella reale; - una risposta negativa del test in disaccordo con quella reale. Si inseriscono i dati in tabella di contingenza e si ha il seguente prospetto: Situazione reale Risultato del test Sopra o uguale al limite Sotto il limite Totali (a+b) e (c+d) positivo (a) (b) a+b negativo (c) (d) c+d Totali (a+c) (b+d) a+b + c +d DOCUMENTI TECNICI Data: 2013-02-06 DT-07-DL/DS rev. 00 Pag. 6 di 47 Situazione reale Sopra o uguale al limite Sotto il limite Totali (a+b) e (c+d) positivo 125 (a) 20 (b) 145 negativo 25 (c) 130 (d) 155 Totali (a+c) e (b+d) 150 150 300 Risultato del test Dal quale posso calcolare: Sensibilità = a /a+c Specificità = d/b+d Quantità di falsi negativi = c/a+c Quantità di falsi positivi = b/b+d Valori predittivi positivi = a/a+b Valori predittivi negativi = d/c+d ottenendo: Sensibilità = 0,83 Specificità = 0,87 Quantità di falsi negativi = 0,17 Quantità di falsi positivi = 0,13 Valori predittivi positivi = 0,86 Valori predittivi negativi = 0,84 Le tabelle di contingenza sono spesso usate per valutare lʼattendibilità dei test di screening o per comparare due test (esempio: test di Mc Nemar). Questi confronti sono basati sulla sensibilità e specificità dei due test quando applicati agli stessi campioni. Uno dei vantaggi delle tabelle di contingenza è che sono di validità generale e possono essere applicate a molti test biologici. Comunque, particolare attenzione deve essere posta alla terminologia in quanto i termini sensibilità e specificità hanno un diverso significato rispetto ai metodi quantitativi. Infatti, la specificità viene definita come la proporzione di negativi veri rispetto al numero totale di negativi reali e la sensibilità come la proporzione di positivi veri rispetto al numero totale di positivi. DOCUMENTI TECNICI Data: 2013-02-06 DT-07-DL/DS rev. 00 Pag. 7 di 47 Le tabelle di contingenza danno unʼidea delle performance totale di un test ma non possono stimare la probabilità di commettere un errore su un singolo campione. Un altro problema per le tabelle di contingenza è che esse dipendono grandemente dal numero di campioni esaminati (numerosità del campione). Le tabelle di contingenza sono molto utilizzate per la valutazione di test immunologici e microbiologici e studi clinici. 3. Il teorema di Bayes Il teorema di Bayes fornisce un metodo per perfezionare la stima della probabilità di un evento quando si rendono disponibili altre informazioni che riguardano quello stesso evento. La forma più utile allo scopo del presente documento è data dalla seguente formula: P(e / A) ! P( A) P ( A / e) = (1) P(e / A) ! P( A) + P(e / ¬A) ! P(¬A) dove: P(A /e) è la probabilità della presenza di A dato lʼevento e; P(A) è la probabilità “a priori” della presenza di A; P(¬A) è la probabilità “a priori” dellʼassenza di A; ! ! P(e / A) è la probabilità dellʼevento e data la presenza di A; P(e / ¬A) è la probabilità dellʼevento e data lʼassenza di A, cioè la probabilità di un falso positivo. Se si vuole dare ai simboli significati comprensibili a chi esegue lʼanalisi, allora con A si può denotare la presenza dellʼanalita di interesse, con ¬ A la sua assenza; con e la risposta positiva del test, con ¬ e la risposta negativa. Così, per mezzo di P(A) possiamo indicare la probabilità che lʼanalita sia presente prima di eseguire il test e con P(¬A) la probabilità che sia assente. Siccome questi due eventi si escludono mutuamente e coprono perciò tutte le possibilità, si può scrivere: P ( A) + P (¬A) = 1 (2) Inoltre, P(¬e / A) è la probabilità di osservare un esito negativo, ¬ e, del test quando lʼanalita A è presente (falso negativo), P(e / A) è la probabilità di osservare lʼesito positivo, e, del test se lʼanalita A è presente (come è già stata definita sopra); P(¬e / ¬A) è la probabilità di osservare un esito negativo, ¬e , del test se lʼanalita A è assente, P(e / ¬A) è la probabilità di osservare un esito positivo, e, del test quando lʼanalita A è assente (falso positivo, come già è stata definita sopra). Relazioni analoghe alla (2) valgono, ovviamente, anche per queste due copie che si escludono mutuamente. Si ha pertanto: P(¬e / A) + P(e / A) = 1 (2a) P(¬e / ¬A) + P(e / ¬A) = 1 (2b) DOCUMENTI TECNICI Data: 2013-02-06 DT-07-DL/DS rev. 00 Pag. 8 di 47 Nella comune pratica analitica, se il risultato, e, del test è positivo, allora P(e / A) è prossima ad 1 a meno di essere in vicinanza del limite di rivelabilità. Infatti, dalla (2a) si ha: P(e / A) = 1 ! P(¬e / A) . Quindi, lʼequazione (1) combinata con la (2a) permette di tener conto di entrambe le probabilità di falso positivo e di falso negativo per stabilire quale sia ora la probabilità della presenza dellʼanalita A dato lʼesito positivo, e, del test . Esempio 1 Si supponga di voler stabilire la presenza dellʼanalita A in un materiale mediante un test o metodo che ha una percentuale di falsi positivi del 3%, cioè: P(e / ¬A) = 0,03 e una percentuale di falsi negativi dello 1%, cioè: P(¬e / A) = 0,01 , dati relativi alle caratteristiche del metodo ricavati dagli studi di validazione. In mancanza di informazioni circa la presenza o lʼassenza di A nel materiale da esaminare, lʼipotesi più plausibile e semplice è che esse siano equiprobabili, cioè: P( A) = P(¬A) = 0,5 . Quale è ora la probabilità “a posteriori”, P(A/e), da attribuire alla presenza di A se il risultato del test, e, è positivo? Tenendo conto della (2a), lʼequazione (1) diventa: P ( A / e) = [1 " P(¬e / A)]! P( A) [1 " P(¬e / A)]! P( A) + P(e / ¬A) ! P(¬A) (3) Sostituendo i valori noti, si ha: (1 " 0,01) ! 0,5 0,495 P ( A / e) = = = 0,9706 (1 " 0,01) ! 0,5 + 0,03 ! 0,5 0,495 + 0,015 Come si vede, il livello di probabilità “a posteriori” riguardante la presenza di A è molto aumentato rispetto a quello “a priori” rispecchiando la maggior sicurezza che si ha sulla presenza dellʼanalita A in seguito allʼesito positivo del test. Se il risultato del test fosse stato negativo, ¬e , quale sarebbe stato la probabilità “a posteriori” P( A / ¬e) della presenza dellʼanalita A ? Il risultato negativo del test non è sufficiente per provare lʼassenza dellʼanalita A. Bisogna infatti tener conto della possibilità di falso negativo. La probabilità P( A / ¬e) si calcola sostituendo nellʼequazione (1) e con ¬e e tenendo conto della (2b). Si ottiene: P ( A / ¬e ) = DOCUMENTI TECNICI Data: 2013-02-06 P(¬e / A) ! P( A) P(¬e / A) ! P( A) + [1 " P(e / ¬A)]! P(¬A) DT-07-DL/DS rev. 00 (4) Pag. 9 di 47 Sostituendo in questa espressione i valori noti, si ha: 0,01 ! 0,5 P( A / ¬e) = = 0,0102 0,01 ! 0,5 + (1 " 0,03) ! 0,5 Naturalmente, se si è in possesso di informazioni che permettono di stabilire una probabilità “a priori” maggiore di 0,5 riguardante la presenza dellʼanalita A, per esempio, P(A) = 0,95 e quindi P(¬A) = 0,05, allora sempre applicando la (1) insieme alla (2a), si ricava: (1 " 0,01) ! 0,95 0,9405 P ( A / e) = = = 0,9984 (1 " 0,01) ! 0,95 + 0,03 ! 0,05 0,9405 + 0,0015 Lʼeffetto del risultato positivo del test aumenta comunque la già alta probabilità della presenza dellʼanalita A. Tuttavia, per diverse ragioni, fra le quali non ultima quella di non disporre dello “storico” riguardante il processo in esame, si preferisce spesso attribuire una equiprobabilità alla presenza o assenza di un analita A, cioè: P(A) = P(¬A) = 0,5. Il teorema di Bayes offre un modo semplice per trattare questa frequente eventualità. Infatti, può essere espresso anche con una formula alternativa alla (1) con la quale si calcola la probabilità di assenza dellʼanalita A dato lʼesito positivo e del test: Si ha: P(e / ¬A) ! P(¬A) P ( ¬A / e ) = (5) P(e / A) ! P( A) + P(e / ¬A) ! P(¬A) Se ora si divide lʼespressione (1) con lʼespressione (5), si ottiene: P ( A / e) P(e / A) P( A) = ! P(¬A / e) P(e / ¬A) P(¬A) (6) Questa è la forma del teorema di Bayes espresso con i rapporti di probabilità (odds). La parte sinistra dellʼequazione descrive il rapporto di probabilità “a posteriori” sulla presenza /assenza dellʼanalita A dato lʼesito positivo, e, del test e si denota con O(A/e), cioè: P ( A / e) O ( A / e) = (6a) P ( ¬A / e ) Nella parte destra dellʼequazione, P(A)/ P(¬A) , è pure un rapporto di probabilità, in questo caso “a priori”, e si denomina con O(A), cioè: P( A) O( A) = (6b) P(¬A) mentre, P(e / A) / P(e / ¬A) è noto come rapporto di verosimiglianza, denominato LR, cioè: P(e / A) 1 ! P(¬e / A) LR = = (6c) P(e / ¬A) P(e / ¬A) DOCUMENTI TECNICI Data: 2013-02-06 DT-07-DL/DS rev. 00 Pag. 10 di 47 In definitiva, lʼespressione (6) può essere riscritta più semplicemente tenendo conto delle (6a), (6b) e (6c) nel modo seguente: O( A / e) = LR ! O( A) (6d) Quindi, per ogni prova concernente lʼanalita A che produce un esito positivo e, il rapporto di probabilità “a posteriori”, O(A/e), è dato dal prodotto del rapporto di verosimiglianza, LR, per il rapporto di probabilità “a priori”, O(A). Ciò significa che il rapporto di verosimiglianza dà la misura della variazione avvenuta nel rapporto di probabilità “a priori” sulla presenza/assenza dellʼanalita A per effetto dellʼesito positivo, e, del test. Inoltre, il rapporto di verosimiglianza non dipende dal valore attribuito alla probabilità “a priori” P(A). Infatti, se si riprendono i dati dellʼesempio 1 sopra riportato in cui: P(¬e / A) = 0,01 e P(e / ¬A) = 0,03, si ha, tenendo della (6c): 1 ! 0,01 0,99 LR = = = 33 0,03 0,03 Spesso, nelle dispute forensi, si preferisce impiegare il valore di LR per giudicare lʼattendibilità dellʼesito positivo del test. Ovviamente, maggiore è il valore di LR maggiore è lʼattendibilità attribuita allʼesito positivo del test. Tuttavia, il valore numerico esatto di LR non viene generalmente usato in tali sedi, dove si preferisce tradurlo qualitativamente in termini di attendibilità “debole”, “buona”, forte” , molto forte”. Il valore di LR ricavato nellʼesempio in esame viene riportato come avente attendibilità collocabile a metà strada tra “debole” e “buona”. È chiaro il motivo del frequente uso di LR. Se non è possibile attribuire un valore alla probabilità “a priori”, P(A) in base alla provenienza del campione o ad altre considerazioni, per evitare difficoltà e contestazioni spesso si preferisce porre P(A) = P(¬A) = 0,5. In questo modo, O(A) = 1 e quindi: O( A / e) = LR . Perciò, tenendo conto della (6a) e della ovvia relazione analoga alle (2): P( A / e) + P(¬A / e) = 1 , si ricava la seguente espressione della probabilità “a posteriori” della presenza dellʼanalita A dato lʼesito positivo, e, del test: LR P ( A / e) = (7) 1 + LR Se ci si riferisce ancora allʼesempio 1, applicando la (7) si trova che la probabilità “a posteriori” P(A/e) è uguale a 0,9706, valore ovviamente identico a quello già calcolato sopra applicando la (1) con la stessa condizione di P(A) = 0,5. Il teorema di Bayes come espresso dalla (6) e dalla (7), quando P(A) = 0,5, riguarda il calcolo della probabilità “a posteriori” P(A/e), cioè la probabilità “a posteriori” nel caso in cui lʼesito del test sia stato positivo. Ma se lʼesito fosse stato negativo, quali sarebbero stati i valori di P( A / ¬e) e di LR ? Per ricavare tali valori, si procede in modo del tutto analogo a quanto mostrato sopra, tenendo conto della (4) e della seguente espressione alternativa, cioè: DOCUMENTI TECNICI Data: 2013-02-06 DT-07-DL/DS rev. 00 Pag. 11 di 47 P ( ¬A / ¬e ) = P(¬e / ¬A) ! P(¬A) P(¬e / A) ! P( A) + [1 " P(e / ¬A)]! P(¬A) (4a) Infatti, dividendo membro a membro la (4) con la (4a), si può ricavare la seguente espressione del teorema di Bayes, analoga alla (6): P ( A / ¬e ) P(¬e / A) P( A) = ! P(¬A / ¬e) P(¬e / ¬A) P(¬A) (8) In questa espressione, si può denominare allo stesso modo: P(¬e / A) P(¬e / A) LR = = P(¬e / ¬A) 1 ! P(e / ¬A) Se si è ipotizzato: P(A) = P(¬A) = 0,5, si ha: P ( A / ¬e ) = LR 1 + LR (8a) (8b) Se si suppone, nellʼesempio 1, che lʼesito del test sia stato negativo, cioè: ¬e , allora sostituendo nella (8a): 0,01 LR = = 0,0103 1 ! 0,03 Sostituendo il valore di LR nella formula (8b), si ottiene: 0,0103 P( A / ¬e) = = 0,0102 1 + 0,0103 Come si vede, si tratta dello stesso valore di probabilità “a posteriori” in caso di esito negativo ¬e del test già calcolato sopra utilizzando lʼespressione (4). 3.1. Modalità di combinazione degli esiti di prove successive La forma dellʼespressione (6), così come quella dellʼespressione (8), si presta immediatamente a tener conto dellʼesito positivo, e2 , di un secondo test. Infatti, dopo lʼesito positivo, e1 , del primo test si può scrivere: P( A / e1 ) P(e1 / A) P( A) = ! P(¬A / e1 ) P(e1 / ¬A) P(¬A) DOCUMENTI TECNICI Data: 2013-02-06 DT-07-DL/DS rev. 00 Pag. 12 di 47 dopo lʼesito positivo, e2 , del secondo test si potrà analogamente scrivere: P[A /(e1 + e2 )] P(e2 / A) P( A / e1 ) = ! P[¬A /(e1 + e2 )] P(e2 / ¬A) P(¬A / e1 ) ossia, si assume come probabilità “a priori” per il secondo test la probabilità “a posteriori” ricavata applicando il teorema di Bayes al primo test. Così, sostituendo lʼespressione di tale probabilità, si ottiene: P[A /(e1 + e2 )] P (e2 / A) P (e1 / A) P ( A) = ! ! P[¬A /(e1 + e2 )] P (e2 / ¬A) P (e1 / ¬A) P (¬A) (9) Se si applicano in successione diversi test al materiale in esame per la misura dellʼanalita A, con lo stesso modo di procedere si ottiene lʼespressione generale: n P[A /(e1 + e2 + ... + en )] P(ei / A) P( A) =" ! P[¬A /(e1 + e2 + ... + en )] i =1 P(ei / ¬A) P(¬A) (10) Se si impiegano i rapporti di probabilità, questa espressione diventa: n O[A /(e1 + e2 + ... + en )]= " ( LR ) i ! O( A) i =1 (11) Come si può facilmente mostrare, lʼordine con cui vengono considerati i test eseguiti non ha alcuna importanza. Se si è ipotizzata lʼequiprobabilità, allora dalla (11), si ha la seguente espressione per la probabilità “a posteriori”: n P[A /(e1 + e2 + ... + en )]= ! ( LR) i i =1 (12) n 1 + ! ( LR ) i i =1 Esempio 2 Si supponga di sottoporre ad esame antidoping lʼurina di un atleta per rivelare lʼeventuale uso di una sostanza proibita attraverso la presenza di un suo metabolita. Dopo lʼesito positivo di una prima prova, per maggiore sicurezza, si sottopone il campione ad una seconda prova che da anchʼessa un risultato positivo. Le caratteristiche di interesse delle due prove sono riportate nella sottostante tabella 1. DOCUMENTI TECNICI Data: 2013-02-06 DT-07-DL/DS rev. 00 Pag. 13 di 47 Test 1 2 Tabella 1 Probab. falso posi- Probab. falso negativo tivo P(e / ¬A) P(¬e / A) 0,033 0,016 0,013 0,057 Probab. vero positivo 1 ! P(¬e / A) 0,984 0,943 Supponendo di non avere informazioni pregresse sulle abitudini dellʼatleta, si adotta per la probabilità “a priori” lʼipotesi della equiprobabilità, cioè: P(A) = 0,5. Dopo il primo test positivo, applicando la (6c) e poi la (7), si ottiene: P( e1 / A ) 0,984 = = 29 ,8 = LR1 P( e1 / ¬A ) 0,033 29,8 P( A / e1 ) = = 0,968 1 + 29,8 Come si può apprezzare soprattutto dal valore di LR1, lʼaffidabilità che può essere attribuita alla presenza del metabolita riscontrata nel campione dopo il primo test è da ritenere non sufficiente. Infatti, nella classificazione dei valori di LR indicata sopra, LR1 è collocabile tra “debole” e “buono”. Si conclude, quindi, che è necessaria lʼesecuzione di un secondo test di conferma basato su un principio chimico-fisico diverso. Tenendo conto delle caratteristiche riportate in tabella 1 per il test 2 e applicando ancora la (6c) e poi la (7), si ha: P( e2 / A ) 0,943 = = 72 ,5 = LR2 P( e2 / ¬A ) 0,013 72,5 = 0,986 1 + 72,5 Il valore di LR2 è da ritenere “buono” per se stesso ma viene molto rafforzato dal fatto di poterlo considerare insieme ad LR1. Infatti, in caso di equiprobabilità, sostituendo nella (9) e nella (12), si ha: P ( A / e2 ) = 2 P[A /(e1 + e2 )] = 29,8 " 72,5 = 2160,5 = ! ( LR ) i P[¬A /(e1 + e2 )] i =1 2160,5 P[A /(e1 + e2 )]= = 0,9995 1 + 2160,5 DOCUMENTI TECNICI Data: 2013-02-06 DT-07-DL/DS rev. 00 Pag. 14 di 47 2 Come si può osservare, il valore del rapporto di verosimiglianza, ! ( LR) i , così ot- i =1 tenuto è molto alto e nella scala delle attendibilità sopra riportata può essere qualificato come “molto forte”. Dʼaltra parte, la probabilità “a posteriori” della presenza del metabolita di interesse dopo lʼesito positivo del secondo test è molto vicina a 1, cioè alla certezza. Quindi, sfruttando la possibilità, offerta dal teorema di Bayes, di cumulare le probabilità dei risultati, si può concludere per una forte indicazione sullʼuso della sostanza proibita. 3.2. Valutazione delle probabilità di risposte false In senso lato, esistono due modalità per valutare le probabilità di risposte false di un procedimento di misurazione. La prima si basa su una previsione dettata dalle caratteristiche note della distribuzione delle risposte ricavabili dal procedimento in uso. La seconda consiste nella esecuzione di una serie, di solito molto numerosa, di misurazioni con quel procedimento, annotando le risposte diverse da quelle attese. 3.2.1 Valutazione a partire dalla distribuzione nota delle risposte Fondamentalmente, è necessario considerare due vie. La prima concerne la consultazione della letteratura sullʼargomento. Essa potrebbe risultare utile per procedimenti riguardanti analiti di generale interesse e tecniche molto diffuse, gli uni e le altre già descritte in metodi normalizzati od ufficiali; tuttavia, il tasso di risposte false riportate deve essere considerato con cautela e non prima di aver condotto una soddisfacente rivalidazione delle caratteristiche principali del procedimento per accertarsi di operare in condizioni abbastanza simili a quelle riportate nei documenti considerati. La seconda si basa sulla convalida esaustiva del procedimento e deve essere seguita obbligatoriamente quando si tratta di un procedimento messo a punto allʼinterno del laboratorio. In particolare, i parametri essenziali da studiare per avere informazioni sulla probabilità di risposte false, oltre, ovviamente al comportamento dellʼanalita a vari livelli, sono: la matrice, la tecnica di rivelazione con lʼassociato limite di rivelabilità, il numero di campioni da esaminare. I meccanismi responsabili della produzione di false risposte sono sostanzialmente due. Il primo è dovuto agli effetti di matrice. Così, da una parte, un materiale non contenente lʼanalita può avere una matrice in cui uno o più componenti interagiscono con il sistema di rivelazione per produrre una risposta falsamente positiva; dallʼaltra parte, uno o più componenti della matrice, diversi dallʼanalita, possono interagire con il rivelatore per inibire la produzione di una risposta effettivamente positiva e dare origine a una risposta falsamente negativa. Il secondo meccanismo opera nelle vicinanze dei limiti di soglia, per esempio un limite di rivelabilità o un limite di decisione (cut-off). Se L è un tale limite di decisione stabilito per il procedimento in uso, ciò significa che un risultato maggiore di L porta DOCUMENTI TECNICI Data: 2013-02-06 DT-07-DL/DS rev. 00 Pag. 15 di 47 a concludere che lʼanalita è presente, mentre un risultato inferiore ad L porta alla conclusione opposta, cioè che lʼanalita è assente. Si immagini di aver esaminato numerosi bianchi; cioè, materiali con matrice della stessa natura di quella dei campioni incogniti ma nei quali è assente (x1 = 0) lʼanalita di interesse. Se la distribuzione dei risultati ottenuti ne comprende qualcuno maggiore di L, questi corrispondono a false risposte positive e formano la base per la stima della probabilità, P(e / ¬A) . In modo analogo, si immagini di aver esaminato numerose volte un materiale contenente lʼanalita al livello di concentrazione x2 > L. Se la distribuzione dei risultati ne comprende qualcuno minore di L, questi corrispondono a false risposte negative e formano la base per la stima della probabilità, P(¬e / A) . La Figura 1 riporta le distribuzioni delle risposte del procedimento per le concentrazioni x1 = 0 , x2 > L e lʼindicazione del limite di decisione L. Le aree tratteggiate a destra e a sinistra di L rappresentano, rispettivamente, la probabilità, P(e / ¬A) , di risposte falsamente positive e la probabilità, P(¬e / A) , di risposte falsamente negative. Entrambe le probabilità possono essere stimate, dopo aver eliminato eventuali risultati anomali (outlier), sulla base degli scarti tipo delle due distribuzioni. È importante notare che le distribuzioni, e quindi le aree tratteggiate di interesse in Figura1, valgono a rigore solo per i livelli di concentrazione x1 e x2. Inoltre, le aree tratteggiate dipendono anche dal valore di L. Tale valore è tipicamente fissato pari a 3 volte lo scarto tipo sperimentale del bianco; ciò significa ritenere che non si verifichino più di 1 o 2 risultati falsamente positivi su 1000 risultati realmente negativi. Anche la probabilità dei risultati falsamente negativi dipende ovviamente dal valore di L; tuttavia, essa è pure influenzata dal livello di concentrazione dellʼanalita attraverso la distribuzione delle risposte del procedimento a quel livello. Per livelli alti, la probabilità di risposte falsamente negative sarà molto bassa, ma tenderà ad assumere valori sempre maggiori man mano che la concentrazione dellʼanalita si avvicina al limite di decisione. Quindi, la consistenza delle risposte falsamente negative è funzione dei livelli di concentrazione dellʼanalita nei materiali da esaminare. La sottostante tabella 2 mostra esempi numerici che chiariscono meglio il significato di queste affermazioni. Livello di x in unità σ 3 4 5 6 Tabella 2 Limite di decisione(1) Limite di decisione(1) (cut- off) pari a 3σ (cut- off) pari a 3,5σ P(e / ¬A) P(¬e / A) P(e / ¬A) P(¬e / A) FP FN FP FN 0,00135 0,50000 0,00023 0,69146 0,00135 0,15866 0,00023 0,30854 0,00135 0,02275 0,00023 0,06681 0,00135 0,00135 0,00023 0,00621 Limite di decisione(1) (cut- off) pari a 4σ P(e / ¬A) P(¬e / A) FP FN 0,00003 0,84134 0,00003 0,50000 0,00003 0,15866 0,00003 0,02275 (1) Si è assunto che il livello del bianco sia uguale a 0. FP, falsi positivi; FN, falsi negativi. DOCUMENTI TECNICI Data: 2013-02-06 DT-07-DL/DS rev. 00 Pag. 16 di 47 Per ciascun limite di decisione (cut-off) e per ciascun livello attuale di concentrazione dellʼanalita, la tabella mostra la frazione di risultati che cade al di sopra di tale limite (falsi positivi) e la frazione che cade al di sotto di tale limite (falsi negativi). Questa situazione corrisponde, nel trattamento statistico del limite di rivelabilità, al rischio α di commettere un errore del primo tipo (falso positivo) e al rischio β di commettere un errore del secondo tipo (falso negativo). È importante trovare un bilanciamento fra i due errori che tenga conto della diversa importanza che può essere legata ai due rischi. È interessante notare che, per un dato livello di decisione (cut-off), la frazione di risultati falsamente positivi è costante, mentre la frazione di risultati falsamente negativi diminuisce al crescere della concentrazione dellʼanalita, come era da attendersi. Considerando le diverse espressioni del teorema di Bayes viste sopra, è possibile quantificare questo andamento con valori numerici, sia mediante il rapporto di verosimiglianza, LR, sia con la probabilità “a posteriori”, P( A / e) , limitando, per semplicità, il calcolo al caso della probabilità “a priori” pari a P(A) = 0,5. Si consideri, anzi tutto, il limite di decisione (cut-off) pari a 3σ. Applicando le formule (2a), (6c) e (7) ai dati del secondo riquadro di tabella 2, si ottengono i valori di LR e di P( A / e) riportati nella sottostante tabella 3. Tabella 3: Limite di decisione (cut-off), L = 3σ e P(A) = 0,5 P ( A / e) Livello di x in unità σ LR 3 370,4 0,99731 4 623,2 0,99840 5 723,9 0,99862 6 739,7 0,99865 Come si può osservare chiaramente in questa tabella, sia i valori di LR che i valori di P( A / e) sono crescenti al crescere di x, cioè crescono man mano che ci si allontana dal limite di decisione, ma il parametro LR aumenta in maniera molto netta raddoppiando il suo valore passando da campioni che hanno una concentrazione x = 3σ a campioni che hanno una concentrazione x = 6σ , mentre il valore di P( A / e) , per lo stesso aumento di concentrazione, passa da 0,99731 a 0,99865, variazione positiva assolutamente irrilevante. Questa è unʼaltra ragione che porta a preferire lʼuso dei valori di LR invece di quelli di P( A / e) . Naturalmente, le probabilità “a posteriori” dellʼassenza di A dato lʼesito positivo e del test, cioè P(¬A / e) non sono nulle, ma costituiscono il complemento allʼunità delle corrispondenti probabilità P( A / e) mentre i valori di LR sono lʼinverso di quelli riportati in tabella. Si consideri, ora, il limite di decisione (cut-off) pari a 3,5σ. Si possono applicare le formule (2a), (6c) e (7) anche al terzo riquadro di tabella 2 ed ottenere per LR e P( A / e) i seguenti valori riportati nella sottostante tabella 4. DOCUMENTI TECNICI Data: 2013-02-06 DT-07-DL/DS rev. 00 Pag. 17 di 47 Tabella 4: Limite di decisione (cut-off), L = 3,5σ e P(A) = 0,5 P ( A / e) Livello di x in unità σ LR 3 1341,5 0,99926 4 3006,3 0,99967 5 4057,3 0,99975 6 4320,8 0,99977 Osservando questi valori si possono fare le stesse osservazioni già fatte per quelli di tabella 3, con queste due aggiunte. La prima riguarda i valori di LR che sono aumentati notevolmente rispetto a quelli di tabella 3; tanto che, passando dal livello di x = 3σ al livello di x = 6σ, il valore è più che triplicato. Ciò è dovuto essenzialmente alla netta diminuzione di P(e / ¬A) , cioè dei falsi positivi, conseguente al fatto di aver considerato un limite di decisione L = 3,5σ. Infatti, è stato così molto diminuito lʼerrore di primo tipo a vantaggio di quello di secondo tipo e di P(¬e / A) (falsi negativi) che è aumentato. I due effetti però non si bilanciano, perché quello dovuto alla variazione dellʼerrore di primo tipo è preponderante rispetto a quello che si ha con lʼerrore di secondo tipo. La conclusione che si trae da queste considerazioni ribadisce chiaramente quanto già affermato sopra circa lʼimportanza da attribuire al valore del limite di decisione L nel calcolo del rapporto di verosimiglianza, LR , e della probabilità “a posteriori”, P( A) / e . La seconda concerne il fatto che, quando la concentrazione dellʼanalita A nel campione risulta: x = 3σ, allora, essendo il limite di decisione (cut-off), L = 3,5σ, può essere interessante valutare lʼeffetto di un esito negativo del test sulla probabilità “a posteriori” della presenza dellʼanalita A. A questo scopo, si applicano le formule (8). Dalla tabella 2 si ricava, per x = 3σ: P(¬e / A) = 0,69146 P(¬e / ¬A) = 1 ! P(e / ¬A) = 1 ! 0,00023 = 0,99977 . Sostituendo nella formula (8), si ha: P ( A / ¬e ) 0,69146 P( A) = ! P(¬A / ¬e) 0,99977 P(¬A) Il rapporto di verosimiglianza è dato dalla (8a), cioè: 0,69146 LR = = 0,69162 0,99977 Nellʼipotesi che P(A) = 0,5, applicando la (8b) si ottiene: 0,69162 P( A / ¬e) = = 0,40885 1 + 0,69162 Come si vede, la probabilità “a posteriori” della presenza dellʼanalita A non è trascurabile anche dopo un esito negativo del test pur su un materiale con una concentrazione x = 3σ dellʼanalita. DOCUMENTI TECNICI Data: 2013-02-06 DT-07-DL/DS rev. 00 Pag. 18 di 47 In questa situazione, è anche interessante calcolare quale sia il rapporto di verosimiglianza, LR, e la probabilità “a posteriori”, P(¬A / ¬e) , dellʼassenza dellʼanalita A dato lʼesito negativo del test. Le formule da applicare sono le inverse della (8), della (8a). Quindi, si ha: P(¬A / ¬e) 0,99977 P(¬A) = ! P ( A / ¬e ) 0,69146 P( A) Tenendo conto di una probabilità “a priori” di assenza dellʼanalita A, P(¬A) = 0,5 , si ha: 0,99977 LR = = 1,44588 0,69146 Da cui: LR 1,44588 P ( ¬A / ¬e ) = = = 0,59115 1 + LR 1 + 1,44588 Come si vede, lʼesito negativo del test comporta un rapporto di verosimiglianza, LR, di poco superiore ad 1 (essendo 1 il valore della assoluta equivalenza tra assenza e presenza dellʼanalita); di conseguenza, la probabilità “a posteriori”, P(¬A / ¬e) , dellʼassenza dellʼanalita dato lʼesito negativo del test subisce solo un lieve incremento rispetto allʼipotesi “a priori” di equiprobabilità di assenza/presenza. In effetti, come era da aspettarsi, lʼesito negativo del test con lʼipotesi di assenza dellʼanalita A comporta un valore di LR inverso e una probabilità “a posteriori” complemento a 1 rispetto ai valori di questi due parametri calcolati sopra con lʼipotesi della presenza dellʼanalita A. Si consideri, infine, il limite di decisione (cut-off) pari a 4σ. Si possono applicare le formule (2a) , (6c) e (7) anche al quarto riquadro di tabella 2 ed ottenere per LR e P( A / e) i seguenti valori riportati nella sottostante tabella 5. Tabella 5: Limite di decisione (cut-off), L = 4σ e P(A) = 0,5 P ( A / e) Livello di x in unità σ LR 3 5288,7 0,99981 4 16666,7 0,99994 5 28044,7 0,99996 6 32575,0 0,99997 Sui valori riportati in questa tabella si possono ripetere qualitativamente le stesse osservazioni già fatte per quelli di tabella 3 e tabella 4. In particolare, anche in questo caso, è interessante valutare lʼeffetto dellʼesito negativo di un test sulla probabilità “a posteriori” di assenza dellʼanalita A quando la concentrazione di tale analita nel campione risulta: x = 3σ, essendo il limite di decisione (cut-off), L = 4σ. DOCUMENTI TECNICI Data: 2013-02-06 DT-07-DL/DS rev. 00 Pag. 19 di 47 Dalla tabella 2 si ricava, per x = 3σ: P(¬e / A) = 0,84134 P(¬e / ¬A) = 1 ! P(e / ¬A) = 1 ! 0,00003 = 0,99997 . Sostituendo nelle inverse della (8) e della (8a), si ha: P(¬A / ¬e) 0,99997 P(¬A) = ! P ( A / ¬e ) 0,84134 P( A) 0,99997 LR = = 1,18854 0,84134 Nellʼipotesi che P(¬A) = 0,5 , si ricava: LR 1,18854 P ( ¬A / ¬e ) = = = 0,54308 1 + LR 1 + 1,18854 Le conclusioni a cui si perviene sono le stesse descritte nel caso precedente; anzi, gli incrementi dei parametri LR e P(¬A / ¬e) sui valori, rispettivamente, 1 e 0,5, corrispondenti alla assoluta equivalenza tra assenza e presenza dellʼanalita A sono addirittura inferiori a quelli del caso precedente. Naturalmente, anche in questo caso, si può mostrare che i valori calcolati di LR e P(¬A / ¬e) sono, rispettivamente, lʼinverso e il complemento a 1 dei valori di LR e P( A / ¬e) che si ottengono considerando lʼipotesi dellʼesito negativo del test in presenza dellʼanalita A . 3.2.2 Valutazione a partire dalla esecuzione di una lunga serie di misurazioni Lʼapproccio più immediato alla stima della probabilità di false risposte consiste nellʼesaminare, con il metodo dʼanalisi di interesse, il maggior numero possibile di materiali compresi nel suo campo di applicazione, compatibilmente con tempi e costi, ed osservare i risultati ottenuti. Naturalmente, i livelli dellʼanalita e le sostanze interferenti considerate dovrebbero essere rappresentative delle situazioni analitiche che il laboratorio può incontrare nellʼesercizio di quel metodo o test. È anche necessario scegliere un adatto metodo di conferma, ovviamente convalidato, con cui esaminare in parallelo gli stessi materiali. Idealmente, la valutazione della probabilità di risposte false è molto semplice. Ad esempio, si supponga di sottoporre ad indagine con il metodo in studio n materiali diversi nei quali è nota lʼassenza dellʼanalita A ricercato oppure questa assenza è stabilita con lʼesame in parallelo mediante il metodo di conferma. Se si ottengono p risposte positive, allora la probabilità di false risposte positive è data semplicemente da p/n, cioè: P(e / ¬A) = p / n . Una espressione analoga si ottiene per la probabilità di false risposte negative, cioè per P(¬e / A) , quando siano stati esaminati materiali con quantità note e maggiori di 0 dellʼanalita A o con risposte positive ottenute con il metodo di conferma. DOCUMENTI TECNICI Data: 2013-02-06 DT-07-DL/DS rev. 00 Pag. 20 di 47 In realtà, questa valutazione si rivela molto difficile poiché il numero di risposte false è generalmente molto piccolo e sorge il problema di stabilire quanti campioni esaminare per essere ragionevolmente sicuri di trovare un numero non nullo di risposte false. In questa situazione, lʼanalista si trova di fronte a un dilemma. Da una parte, non conoscendo quale sia, neanche approssimativamente, questo numero (è ciò che si prefigge di determinare) non può decidere quanti campioni esaminare; dallʼaltra parte, se decide di continuare la sperimentazione fino a riscontrare una risposta falsa, questo modo di procedere non gli permette di arrivare a disegnare un quadro reale della probabilità di risposte false. Infatti, una risposta falsa può verificarsi al primo esame ma non ripetersi più per molti altri successivi esami. In ogni caso, il numero di campioni da esaminare per stabilire la percentuale di false risposte di un procedimento è sempre molto alto. Per ovviare a questa difficoltà, tenendo conto, quando possibile, della passata esperienza o della letteratura, si può ipotizzare una percentuale di false risposte che si ritiene accettabile e procedere alla sua verifica ipotizzando che la distribuzione di tali risposte sia modellata su quella di Poisson, così espressa: !i P(i ) = e #! " (13) i! dove: λ è il valore centrale della distribuzione; e, è la base dei logaritmi naturali; e i! è il fattoriale di i. Si supponga, per esempio, che lo 1% di false risposte positive sia ritenuto accettabile per il procedimento in esame. Ciò significa considerare λ = 1. Da cui: P(i = 0) = 0,368; P(i = 1) = 0,368; P(i = 2) = 0,184; P(i = 3) = 0,06. Perciò, se vengono esaminati 30 campioni privi dellʼanalita di interesse e prelevati a caso, almeno 11 non dovranno presentare risposte positive, altri 11 o 12 una sola, 6-7 due e 0-2 tre. 3.3. Applicazioni del teorema di Bayes In molti casi in cui vengono eseguite analisi qualitative si ritiene necessario applicare in parallelo un metodo di conferma. Ciò è particolarmente vero quando lʼindagine è condotta a scopi forensi, di diagnosi medica, oppure coinvolge problemi di sicurezza o importanti investimenti. In breve, in tutti i casi in cui si avverte che una classificazione errata avrebbe serie conseguenze, si decide di esaminare i campioni anche con il metodo di conferma. Le probabilità di false risposte, P(e / ¬A) e P(¬e / A) , stimate come descritte in precedenza, si impiegano quando la correttezza della presunta classificazione non è critica mentre alto è il costo della conferma. Infatti, nella routine, risultati positivi si confermano con un metodo indipendente ogni qual volta ci si aspetta che lʼanalita sia assente nel campione. I risultati negativi non vengono confermati per ridurre i costi. Analogamente, se ci si aspetta che lʼanalita sia presente, un risultato negativo viene confermato ma non uno positivo. Per il resto, il risultato del test viene accompagnato dal valore di P(e / ¬A) o di P(¬e / A) oppure dal valore del rapporto di veroDOCUMENTI TECNICI Data: 2013-02-06 DT-07-DL/DS rev. 00 Pag. 21 di 47 simiglianza, LR , se non è noto il valore della probabilità “a priori” sulla presenza, P(A), o sulla assenza, P(¬A) , dellʼanalita A di interesse e si è ipotizzato P(A) = P(¬A) oppure si riporta il valore della probabilità “a posteriori” se è nota una probabilità “a priori” tale che: P(A) ≠ P (¬A) . Bisogna, inoltre, tener presente la possibilità di decidere lʼappropriata classificazione di un oggetto in seguito agli esiti di una serie di test (si veda il paragrafo 4) di facile esecuzione anche se poco precisi invece dellʼimpiego di un singolo metodo preciso ma molto più impegnativo in termini di tempo o di costi. Così, per ricavare una particolare valutazione qualitativa, un analista può eseguire diversi test fino a che lʼoggetto di interesse sia classificato con un adeguato livello di probabilità oppure lʼindagine si debba concludere per aver raggiunto il limite di tempo o di costo stabilito. In Figura 2 viene rappresentato un percorso analitico iterativo che indica come procedere nella valutazione cumulativa degli esiti di successivi test, in termini, n ad esempio di " = ! ( LR ) i , cioè del prodotto dei rapporti di verosimiglianza corrii =1 spondenti. Per decidere quando interrompere la sperimentazione, si può impiegare il criterio: (14) ! > !T dove: ФT è il valore critico prefissato che deve essere superato dal prodotto n ! ( LR) i . i =1 In pratica, il procedimento consiste semplicemente nel confrontare ! con ! T man mano che si acquisiscono i risultati dei test interrompendo il percorso analitico una volta che la (14) sia soddisfatta. 3.4. Conclusioni per il teorema di Bayes Il teorema di Bayes mette a disposizione un semplice strumento numerico per valutare lʼattendibilità di una analisi qualitativa combinando nel valore di un unico parametro le probabilità di falso positivo e di falso negativo. Tale parametro può essere espresso in due modi diversi, con il rapporto di verosimiglianza o con la probabilità “a posteriori”, a seconda che non si disponga o si disponga di una informazione sulla probabilità “a priori”. Siccome, in genere, si verifica la prima situazione, il rapporto di verosimiglianza è il più frequentemente usato. Va, comunque, ricordato che la classificazione effettuata è tanto più obiettiva quanto più lo sono i valori dei parametri di convalida del test o del metodo impiegato e che uno dei maggiori vantaggi di questo modo di valutare le analisi qualitative consiste nel rendere possibile e facile un esame critico dei procedimenti e delle ipotesi considerate. DOCUMENTI TECNICI Data: 2013-02-06 DT-07-DL/DS rev. 00 Pag. 22 di 47 DOCUMENTI TECNICI Data: 2013-02-06 DT-07-DL/DS rev. 00 Pag. 23 di 47 DOCUMENTI TECNICI Data: 2013-02-06 DT-07-DL/DS rev. 00 Pag. 24 di 47 4. Metodo degli intervalli statistici Questa procedura [Pulido et al., 2002] è basata come nelle analisi quantitative sulla distribuzione gaussiana che viene ampiamente utilizzata nel determinare i limiti di rivelabilità di un metodo. Questa procedura richiede di stabilire una relazione tra il limite di specifica, spesso espresso come concentrazione e la risposta strumentale. Per confronto della risposta di un campione qualsiasi con uno al limite di specifica, si prende una decisione si/no specificando la probabilità di commettere un errore. Rispetto a Bayes e le tabelle di contingenza vi sono due principali differenze: - Si utilizzano le risposte strumentali per cui si lavora con dati continui e non binari; - Per stabilire lʼincertezza, i campioni da analizzare vengono preparati al livello di concentrazione del limite di specifica, al contrario degli altri metodi in cui campioni da analizzare erano prepararti a differenti livelli di concentrazione. Con il metodo degli intervalli statistici, la sperimentazione comprende un set di campioni tutti contenenti lʼanalita al limite di specifica che vengono analizzati nSL volte in condizioni di precisione intermedia in modo da includere la maggior sorgente di imprecisione. In questo modo si può calcolare la media della risposta strumentale (rsl) e la sua deviazione standard (s). Per comparare se una risposta strumentale (ri) di un campione è minore o uguale o più alta del limite di specifica, rSL, si stabilisce un limite di cut-off (rcutoff) ( vedi Fig.1). Se si assume che la risposta strumentale segue una distribuzione normale, il rcut-off si calcola dal limite di predizione più basso della media delle risposte strumentali (rSL): rcutoff = rSL ± t(v,alfa) x sSL (1) dove sSL è calcolato da : sSL = (1/m + 1/nSLl)1/2 x s DOCUMENTI TECNICI Data: 2013-02-06 (2) DT-07-DL/DS rev. 00 Pag. 25 di 47 dove t è il valore tabulato della statistica t al livello di significatività voluto con ν gradi di libertà. nSL sono il numero di determinazioni indipendenti fatte per calcolare rSL ed m è il numero di repliche fatte sul campione in esame . Normalmente m = 1. Il segno + o – nellʼequazione 1 dipende da come si stabilisce il limite della specifica. Passiamo ora allʼesame dellʼesempio del limite di aflatossina di 2 mg/l. È evidente che in questo esempio solo il segnale superiore è quello che interessa. Con la tecnica usuale vengono analizzati 34 campioni tutti contenenti aflatossina B1 al livello di 2 µ/g. Si sono ottenuti i seguenti risultati: Media delle 34 risposte strumentali rSL = 0,483 con s = 0,038 sSL = (1 + 1/34)1/2 x s = 0,039 Da cui per α = 5% dallʼequazioni sopra: rcut-off = 0,551 Ne consegue che tutti i campioni con un r ≤ a 0,551 sono statisticamente uguali o più bassi del limite legale. La probabilità di commettere un errore è del 5%. (Fig. 1a). Allo stesso modo tutti i campioni che sono al di sotto dellʼ rcut-off sono statisticamente più alti di rSL e quindi non conformi al limite di legge (Fig.1b) Quindi 0.551 è il limite strumentale invalicabile per dichiarare conforme un prodotto. Risulta evidente come la conformità dipenda dalla scelta a priori della probabilità alfa di commettere un errore del I tipo (o falso positivo). In pratica, una volta fissato α lʼanalista è in grado di prendere una decisione a posteriori circa la conformità di un dato campione. Questo significa che la decisione viene presa dopo che si è registrato il segnale del campione. In questo modo lʼincertezza di misura è spostata dal risultato analitico al limite di cut-off e la decisione avviene sulla base del confronto di ri con rcutoff. Questa strategia è molto utile per i metodi di screening che devono essere utilizzati in modo routinario. DOCUMENTI TECNICI Data: 2013-02-06 DT-07-DL/DS rev. 00 Pag. 26 di 47 Figura 1 – Metodo degli intervalli statistici ( Pulido et al., 2002) Si può anche calcolare un limite di screening (Fig. 2), rscreening, considerando la probabilità di commettere un errore del II tipo (o falso negativo). Considerando sempre lʼesempio delle aflatossine in cui la concentrazione di un analita in un campione non può essere sopra il limite di specifica csl , β rappresenta la probabilità di giudicare il campione conforme quando non lo è (cioè quando è superiore al csl). In questo caso per calcolare rscreening si usa la seguente equazione: rscreening = rSL + t(α,β, v) x sSL (3) in cui lʼanalista deve fissare due dei seguenti tre parametri: alfa, beta e rscreening - rSL . Questʼultimo non è altro che la minima differenza attesa tra ri e rSL che lʼanalista desidera rilevare alle probabilità alfa e beta stabilite. Delta (alfa,beta,v) dipende quindi dalle probabilità di errore alfa e beta. Ancora sSL è calcolato dalla relazione 2. Dallʼequazione 3 può essere dedotto che il limite di screening dipende dalle probabilità di commettere errori del I e II tipo. DOCUMENTI TECNICI Data: 2013-02-06 DT-07-DL/DS rev. 00 Pag. 27 di 47 rscreening può essere calcolato ( per esempio quando una concentrazione deve essere minore del limite specificato ) facendo lo stesso ragionamento e cambiando i segni nellʼequazione 3. Il limite di screening è un valore a priori che una volta trasformato in concentrazione può essere utilizzato per paragonare metodi differenti o per selezionare un dato metodo per un problema specifico. Questa metodologia può essere applicata solo quando si utilizza uno screening strumentale che fornisce risposte numeriche o continue. Non può essere applicato quando si hanno risultati dicotomici (i.e. si/no) come nel caso di analisi con kit. Questa metodologia, al contrario delle altre viste prima che assegnano probabilità basate su campioni analizzati prima, al contrario tiene in considerazione il campione individuale in esame. Figura 2 – Metodo del limite di screening 5. Le curve di potenza Un altro modo per stabilire lʼincertezza nelle analisi qualitative è quello delle curve di potenza. Queste curve vengono stabilite utilizzando una tecnica di screening basata sullʼanalisi di molti campioni a differenti livelli di concentrazioni. Il metodo di operare è semplice: campioni “bianchi” vengono addizionati di differenti livelli di concentrazione di analita in modo che la loro concentrazione sia al di sopra o al di sotto del limite della specifica. Si fanno molte repliche a ciascuna concentrazione in condizioni di precisione intermedia. A ciascun livello di concentrazione si valuta il numero di risultati positivi e poi si mettono in grafico il numero della % di positivi vs la concentrazione. Questo grafico permette di determinare il cut-off della concentrazione cioè la concentrazione dalla quale la risposta ottenuta è superiore al limite di specifica per una data probabilità di commettere un errore. Si può anche stabilire un intervallo o regione di incertezza in cui le probabilità alfa e beta possono essere calcolate. DOCUMENTI TECNICI Data: 2013-02-06 DT-07-DL/DS rev. 00 Pag. 28 di 47 La Fig. 3 mostra una curva di performance ottenuta per la determinazione dellʼaflatossina B1 mediante il test ELISA. Figura 3 – Metodo delle curve di potenza Per ottenere la curva di performance, sono state preparate campioni addizionati dellʼanalita a cinque livelli di concentrazione di cui due sopra o sotto il limite del limite di specifica ed una al limite di specifica. A ciascun livello sono state effettuate 10 determinazioni (vedere tabella 1). Una volta effettuate le analisi sono state calcolate le percentuali dei risultati positivi o negativi ottenuti (tabella 1). Queste risposte sono state utilizzate per costruire il grafico di Figura 3 dal quale è possibile determinare la concentrazione cut-off in base al livello di probabilità di commettere un errore alfa e beta (cioè falso positivo e falso negativo). Risultati positivi e negativi ottenuti nellʼanalisi del bianco e del bianco addizionato a differenti livelli di concentrazione Concentrazione Risultati positivi (negativi) Risposte positive 3 10 (0) 100 2,5 10 (0) 100 2 5 (5) 50 1,5 1 (9) 10 1 0 (10) 0 Questa concentrazione può essere rappresentata sul grafico da una linea verticale che può essere spostato a destra o sinistra a seconda delle probabilità prescelte. Se si considera un campione ad un livello specificato (per esempio 2 mg) si avrebbe un risultato accettabile solo il 50% delle volte. Considerato che si vuole avere un bassa percentuale di falsi negativi essendo la sostanza pericolosa, possiamo porre il livello di cut off tra 1,5 e 1,0 µg /g. DOCUMENTI TECNICI Data: 2013-02-06 DT-07-DL/DS rev. 00 Pag. 29 di 47 Se lo poniamo a 1.5, il 10% (1 su 10) delle nostre decisioni sarebbero false positive, cioè che le avremmo considerate sopra il limite di specifica mentre di fatto sarebbero al disotto del limite. Per stabilire la regione di incertezza, devono essere fissate le % di falsi positivi e falsi negativi. Nellʼesempio precedente se fissiamo le probabilità al 5% la regione id incertezza sarà tra 1,25 e 2,4 µg /g. È chiaro che più precisa è la curva di performance più piccola sarà la regione dellʼincertezza che naturalmente dipende dal numero di misurazioni ripetute effettuate a ciascun livello e dal numero dei livelli considerati. Lo svantaggio di questo metodo rispetto, per esempio, a quello di Bayes è che quando il numero delle misurazioni ripetute in una certa regione è basso, è anche bassa la probabilità di trovare risultati positivi o negativi in una popolazione finita di campioni. È evidente che aumentando il numero delle misurazioni ripetute il metodo diventa costoso ed il tempo di analisi molto lungo. Questo approccio è invece utile quando non si conosce la precisione del metodo che per esempio è stato sviluppato di recente nel laboratorio (metodo interno). È utile anche quando si lavora con KIT che forniscono risultati positivi o negativi. Quando si ottengono risultati dubbi la curva di performance varia. Infine, è utile ricordare che questo è un metodo generale che può essere applicato a tutti i sistemi di screening. 6. Conclusioni Selezionare una specifica procedura dipende dal problema analitico che si deve affrontare e dalla tecnica di screening che si utilizza. Per esempio se la tecnica di screening fornisce solo risultati positivi o negativi (risposta dicotoma) la sola procedura che non può essere applicata è quella degli intervalli statistici. Le tabelle di contingenza sono invece di applicazione generale. Al contrario, quando si ha che fare con tecniche che forniscono una risposta continua la procedura da raccomandare è quella degli intervalli statistici. Il calcolo per stimare lʼincertezza dei diversi metodi sono differenti sia per il numero che per i livelli di concentrazione. Quando si usano le tabelle di contingenza vengono analizzati campioni a differenti livelli di concentrazione sebbene i campioni sono considerati in solo due livelli di concentrazione (alto e basso rispetto al limite della specifica). Allo stesso modo quando vengono utilizzate le curve caratteristiche sono necessarie analisi a diversi livelli di concentrazione e numerose analisi a ciascun livello. Infine, quando vengono utilizzati gli intervalli statistici devono essere analizzati molti campioni ma ad un solo livello di concentrazione. È utile, infine, segnalare alcune particolarità del settore medico che sono illustrate nella appendice A. DOCUMENTI TECNICI Data: 2013-02-06 DT-07-DL/DS rev. 00 Pag. 30 di 47 Appendice A. Indicazioni pratiche MEQUALAN CLSI EP12 e Come abbiamo visto le analisi qualitative consistono in un processo di classificazione. Oggetti o materiali vengono assegnati ad una determinata classe sulla base delle risposte ottenute attraverso i test a cui vengono sottoposti. Sovente i laboratori medici forniscono agli utenti risultati qualitativi nominali (presente/assente, positivo/negativo, reattivo/non reattivo, etc..) oppure qualitativi ordinali (negativo-grayzone, debolmente positivo, positivo, fortemente positivo, ecc.) come interpretazione di misurazioni quantitative in base a livelli soglia (cut-off) stabiliti da norme, linee guida, convenzioni o dal produttore dei consumabili impiegati. In altri casi il risultato qualitativo ordinale (negativo/debolmente positivo/positivo +/positivo ++/positivo +++) è ottenuto come tale dal processo di misura (per esempio, reazioni di agglutinazione). Analogamente, in molti metodi il risultato qualitativo nominale è fornito direttamente dal metodo analitico (ricerche colturali, metodi immuno-cromatografici, reazioni a lettura visuale, etc.). Nel primo caso (interpretazione qualitativa di una misura quantitativa) l'incertezza di misura appartiene al procedimento di misura strumentale e si applicano conseguentemente le raccomandazioni descritte nei documenti pertinenti [BIPM, et al., 2007; EA4/16, 2003; Sinal DT-0002, 2000; Eurachem/Citac, 2000]. La guida Sinal DT-0002/6, Guida al calcolo della ripetibilità, infatti, ricorda che “[...] In questi ultimi casi al laboratorio si richiede di effettuare una stima di ripetibilità sulle grandezze di ingresso/stimolo.”. Possiamo senz'altro considerare esempi di grandezze di ingresso/stimolo i risultati espressi in unità arbitrarie, in unità internazionali, in densità ottica espressa come rapporto con un valore soglia o cut-off. Negli altri casi, invece, quando non è disponibile alcun risultato quantitativo, l'analisi della variabilità può basarsi solo sulla probabilità dei risultati errati (falsi positivi, falsi negativi). A.1. Variabilità dei risultati qualitativi. CLSI EP12 e MEQUALAN A.1.1 CLSI-EP12 - Evaluation of Qualitative Test Performance Nella revisione 2005/2006 della linea guida EP12 del Clinical and Laboratory standards Institute [Clinical and.., 2007], il gruppo di lavoro ha aggiunto al protocollo di valutazione le informazioni sui limiti di confidenza ottenuti da un certo numero di risultati raccolti, consentendo all'utente di visualizzare direttamente la differenza di limiti di fiducia quando si riduce o si aumenta il numero di osservazioni effettuate. Inoltre, sono stati inseriti e definiti alcuni nuovi termini. Il termine "intervallo C5-C95" è usato per descrivere l'intervallo intorno al valore soglia (C50), dove i risultati positivi vanno dal 5 al 95% . DOCUMENTI TECNICI Data: 2013-02-06 DT-07-DL/DS rev. 00 Pag. 31 di 47 Il cut-off di un metodo qualitativo è la soglia sopra la quale il risultato è riferito come positivo e sotto la quale è invece dato come negativo. La soglia di concentrazione, qui indicata come C50, è la concentrazione a cui il 50% di una grande serie di risultati è positivo. Se si esegue una grande serie di prove su un campione con concentrazione effettiva superiore a C50, ci si aspetterebbe risultati positivi in più del 50% dei casi. Allo stesso modo, a concentrazioni al di sotto del cut-off, ci si aspetterebbe risultati negativi, in più del 50% dei casi. Maggiore è la concentrazione al di sopra della soglia (o più bassa è la concentrazione al di sotto della soglia) nel campione sottoposto a prova, maggiore è la probabilità che i risultati ripetuti siano positivi (o negativi). La Figura 4 qui di seguito riportata è una rappresentazione grafica di come la percentuale di risultati positivi e negativi di una grande serie dovrebbero variare in funzione della effettiva concentrazione intorno al cut-off. Nella Figura 4, si nota che l'aumento della concentrazione di analita di piccole quantità (spostamento a destra del cut-off) e l'esecuzione di un gran numero di prove su ciascun campione, dovrebbe produrre corrispondentemente più risultati positivi (si spostano verso l'alto sulla asse verticale a sinistra), e meno risultati negativi (in alto sull'asse verticale a destra). Allo stesso modo, diminuendo le concentrazioni dello stesso valore (spostamento a sinistra del cut-off), si dovrebbero produrre corrispondentemente meno risultati positivi (spostarsi in basso sulll'asse verticale a sinistra) e maggiori percentuali di risultati negativi (spostarsi in basso sull'asse verticale a destra). La forma attuale e la pendenza della curva sarà diversa per i vari metodi studiati. Questa descrizione del cut-off o punto discriminante in una prova qualitativa consente di comprendere il fatto che, a causa dell'imprecisione, i campioni con concentrazioni di analita vicino alla soglia non darà risultati completamente coerenti (nel senso positivo o negativo, più o meno, assente o presente) con più osservazioni dello stesso campione. Figura 4 - Curva di potenza, risultati positivi in funzione della concentrazione. (ridisegnato da CLSI-EP12) DOCUMENTI TECNICI Data: 2013-02-06 DT-07-DL/DS rev. 00 Pag. 32 di 47 Ci sono diversi modi per descrivere la variabilità dei risultati ripetuti per i campioni con concentrazione vicino a C50. La concentrazione superiore a C50 in cui i risulta ti sono positivi al 95% e la concentrazione al di sotto di C50 in cui i risultati sono al 95% negativi sono state chiamate "95% intervallo" per il metodo. Tuttavia, questa terminologia è stata a volte confusa con il 95% intervallo di fiducia per il livello soglia. Invece, la nuova terminologia " intervallo C5-C95 " come indicato (C5-C95) è introdotta appunto al fine di rappresentare "l'intervallo da C5 a C95." La lettera "C" rappresenta la concentrazione, e il pedice indica la percentuale di risultati positivi. Quando si guarda ai risultati positivi, C5 è la concentrazione al di sotto C50 in cui i risultati sono più del 5% positivi o negativi del 95% (l'estremo inferiore del 95% intervallo), e C95 è la concentrazione sopra C50 in cui i risultati sono più del 95% positivi o negativi del 5% (l'estremo superiore del 95% intervallo). Una discrepanza tra un cut-off dichiarato ed una vera soglia C50 rappresenta un errore sistematico (bias). A concentrazioni al di fuori dellʼintervallo C5-C95 (<C5 o >C95), la capacità di un metodo di produrre costantemente lo stesso risultato su osservazioni ripetute nello stesso campione è una caratteristica di robustezza. L'ampiezza di C5-C95 fornisce informazioni circa la precisione dei test qualitativi perché essa riflette la percentuale effettiva di concentrazioni a cui i risultati ripetuti sono incoerenti. La Figura 2 è una rappresentazione grafica di come la percentuale di controlli positivi e negativi in una grande serie di risultati varia in funzione della concentrazione effettiva del campione vicino a C50 in due situazioni (per entrambe le situazioni, la concentrazione C50 è lo stesso, quindi non vi non è sistematica differenza tra i due casi). Nel caso 1, la curva è molto ripida vicino C50, e solo un piccolo incremento di concentrazione in entrambe le direzioni avrebbe reso quasi tutti positivi o tutti risultati negativi. Nel Caso 2, la curva è meno ripida vicino C50, e gli stessi piccoli incrementi darebbero una combinazione di risultati positivi e negativi. CLSI EP12/A2 descrive quindi un esperimento per la precisione di questi metodi. L'approccio deriva da quello originariamente proposto da ECCLS, che non fornisce in realtà l'intervallo C5-C95, ma stabilisce se un intervallo di concentrazioni pari a ± 20% intorno a C50 è maggiore o minore di C5-C95. Da notare che l'intervallo ± 20% è scelto a scopo squisitamente didattico e dimostrativo, un po' come l'intervallo ± 2 volte lo scarto tipo in altri campi. Nel singolo caso l'intervallo da valutare dovrà essere stabilito in base all'utilizzo dei risultati. A.1.2 Progetto MEQUALAN Il progetto MEQUALAN è stato promosso dalla Unione Europea per arrivare ad avere risposte semplici, tipo sì o no, dalle analisi chimiche qualitative. Il documento finale, pubblicato nel 2003, contiene valide indicazioni per la stima dell'incertezza di misura [Rìosl et al., 2003]. Come in CLSI EP12-A2, l'incertezza di misura è un intervallo di concentrazioni (C0C1) intorno al livello soglia CDL. DOCUMENTI TECNICI Data: 2013-02-06 DT-07-DL/DS rev. 00 Pag. 33 di 47 L'esperimento per determinare l'intervallo C0-C1 di incertezza consiste secondo MEQUALAN nell'analisi di 10 replicati di 5 preparati, distribuiti in altrettanti livelli di concentrazione, di cui uno al livello soglia (CDL), due sotto e due sopra. La stima di C0 e C1 si ottiene per estrapolazione dalla regressione lineare tra concentrazione e frequenza di positivi. Figura 5 - Curve di potenza di metodi diversi (ridisegnato da CLSI-EP12). Figura 6. Approccio MEQUALAN all'incertezza dei metodi qualitativi DOCUMENTI TECNICI Data: 2013-02-06 DT-07-DL/DS rev. 00 Pag. 34 di 47 Figura 7. Esperimento MEQUALAN per l'incertezza A.2 Casi d'uso Caso A. Metodo per la rilevazione di popolazioni miste di eritrociti [MEQUALAN, web ] Nel campo dell'anti-doping, si possono usare due approcci per dimostrare la presenza di una sostanza proibita in un campione o l'uso di una sostanza proibita in un atleta. Il primo approccio è diretto: un metodo analitico dimostra la presenza della sostanza. Il secondo approccio, indiretto, punta a dimostrare variazioni nel metabolismo causate dal doping. Un esempio di metodo diretto per dimostrare la presenza nel sangue dell'atleta di popolazioni differenti di eritrociti derivanti da trasfusione omologa (o allogenetica) si basa sulle piccole differenze tra antigeni eritrocitari minori tra donatore e ricevente, che possono essere rivelate dai fenotipi analizzati con tecniche in citometria di flusso e reagenti immunoematologici ordinari. Le analisi in citometria di flusso possono essere realizzate con un citometro dotato di un software opportuno. Il software utilizza i segnali nel canale frontale (forward channel) confrontati con quelli nei canali laterali (sideward channels) con una scala lineare (piuttosto che logaritmica) e parametri stabiliti. Si conteggiano 50.000 eventi per ciascun anticorpo e si utilizzano le letture di un controllo interno (col solo anticorpo secondario) per aggiustare il voltaggio del canale FL1 intorno al valore 1 di fluorescenza. Quindi si leggono i campioni. DOCUMENTI TECNICI Data: 2013-02-06 DT-07-DL/DS rev. 00 Pag. 35 di 47 Per interpretare i risultati servono altri due controlli: con uno si identifica la posizione di un secondo picco di eventi, mentre il terzo conferma la posizione del picco intorno al valore 1. Ciascun istogramma viene classificato come incerto, popolazione singola o popolazione doppia. Un picco secondario valido deve avere più di 100 eventi con un rapporto segnale/fondo maggiore di 3. Il segnale è definito come “numero di eventi nella regione che definisce il picco minore”. In caso di dubbio, l'istogramma è interpretato come popolazione singola. L'interpretazione finale può essere: campione negativo, sospetto o positivo. Il sospetto ha solo un istogramma con doppia popolazione. Il positivo ha almeno due istogrammi con doppia popolazione. Ai fini della validazione del metodo, quindi della determinazione dell'incertezza di misura e del limite di ripetibilità, il risultato da considerare non può essere né l'interpretazione del campione (positivo/negativo/sospetto) né quella dell'istogramma (doppia/incerto/singola) bensì il valore quantitativo del “numero di eventi nel picco minore”, come indicato dall'autore del metodo originale [Giraud et al., 2008]. Caso B. Analisi chirale delle amfetamine Circa 34 milioni di persone nel mondo abusa di stimolanti come le amfetamine, soprattutto metamfetamina. Queste sostanze hanno uno o più atomi di carbonio asimmetrico, quindi possono presentarsi come differenti enantiomeri, che hanno valore legale. Infatti, la metamfetamina si trova di più come d-isomero, ma anche come miscela di isomero d ed isomero l, che hanno effetti farmacologici diversi. lmetamfetamina è 5-10 volte più potente della l-metamfetamina sul sistema nervoso centrale. La separazione chirale delle amfetamine si può fare con elettroforesi capillare. Si aggiunge un separatore chirale (di solito ciclodestrina) o uni dei suoi derivati. Il metodo più usato per la rilevazione è l'assorbimento in UV. Recentemente, come alternativa più specifica e sensibile è stata proposta la spettrometria di massa. Sono stati determinati ripetibilità e limiti di rivelazione per un metodo di questo tipo. Il coefficiente di variazione nella serie dei tempi di ritenzione e delle aree del picco degli enantiomeri di 6 composti sono risultati inferiori a 0,58% e 7,83%. Tra le serie arrivano al massimo a 1,58% e 9,97% rispettivamente. Il limite di rivelazione è stato definito come segnale 3-4 volte il livello del fondo ed è stato determinato come 0,01 μg/mL per metamfetamina. Le curve di taratura sono state dimostrate lineari tra 0,05 e 10 μg/mL. I laboratori antidoping cercano la metamfetamina e usano come campo di misura i valori superiori a 25 ng/mL. Dall'esame si ricavano valori quantitativi, espressi come concentrazione o come quoziente con il campione (di misura) interno, interpretati ai fini legali come presente/assente. Ai fini della validazione del metodo, quindi della determinazione dell'incertezza di misura e del limite di ripetibilità, il risultato da considerare non può essere l'interpretazione del campione (presente/assente) bensì il valore quantitativo della concentrazione in ng/mL o come rapporto con il campione (di misura) interno. DOCUMENTI TECNICI Data: 2013-02-06 DT-07-DL/DS rev. 00 Pag. 36 di 47 Caso C. Identificazione di eritropoietina e darpoetina alfa [Iio et al., 2005] La World Anti-Doping Agency (WADA) inserisce l'eritropoietina (EPO) e gli analoghi sintetici tra le sostanze proibite di tipo “non soglia”, ossia sostanze che trovate in qualsiasi quantità costituiscono violazione della regola antidoping. La ricerca di eritropoietina e analoghi si avvale della tecnica di Isoelectric Focusing (IEF), in un intervallo di pH compatibile col punto isoelettrico delle diverse sostanze (solitamente tra 2 e 6) e in condizioni denaturanti con urea 7M. Dopo la separazione, si esegue un doppio trasferimento (blotting). Nel primo blot, le proteine nel gel sono trasferite in una prima membrana PVDF. Quindi l'anticorpo monoclonale (mAb) cloneAE7A5 viene applicato per riconoscere EPO. Il secondo blot distrugge l'interazione tra EPO e mAb a pH acido, così mAb viene trasferito alla seconda membrana PVDF. La posizione del mAb sulla membrana è rivelata aggiungendo una sequenza di reagenti (anticorpo secondario anti-topobiotinilato, complesso perossidasi-streptavidina, substrato chemiluminescente) terminata dalla perossidasi. L'immagine viene interpretata con i seguenti criteri: rEPO 1. nell'area basica ci sono 3 bande consecutive accettabili; 2. le due bande più intense alla densitometria sono tra queste e sono consecutive; 3. ciascuna delle due bande più intense deve essere in densitometria almeno due volte più intensa di qualsiasi banda nell'area “endogena”; NESP 1. nell'area acida ci sono 3 bande consecutive accettabili (B, C e D); 2. le banda più intense alla densitometria è la seconda o la terza (C e D); 3. la banda più intensa nell'area acida deve essere in densitometria almeno due volte più intensa di qualsiasi banda nell'area “endogena”. Ai fini della validazione del metodo, quindi della determinazione dell'incertezza di misura e del limite di ripetibilità, il risultato da considerare può essere l'interpretazione del campione (presente/assente) con i criteri stabiliti, anche se il valore quantitativo della densitometria è in pratica disponibile. Caso D. determinazione immunoenzimatica della teofillina Nei cavalli da corsa sono attualmente utilizzate diverse molecole, farmaci antiinfiammatori non steroidei (FANS) e teofillina, di cui sono ben conosciuti gli effetti farmacologici sulla circolazione e la respirazione. La teofillina è inclusa nelle sostanze proibite dalla USEF [Sanford et al., 1974; United....2007]. La determinazione della teofillina è ottenuta per lo più con metodi immunometrici, meno spesso con metodi cromatografici. Un tipico cut-off nelle urine è 30 ng/mL [Garcinuno et al., 2000; Caslavska et al., 1999]. Ai fini della validazione del metodo, quindi della determinazione dell'incertezza di misura e del limite di ripetibilità, il risultato da considerare non può essere l'interpretazione del campione (presente/assente) bensì il valore quantitativo della concentrazione in ng/mL o come rapporto con il campione (di misura) interno. DOCUMENTI TECNICI Data: 2013-02-06 DT-07-DL/DS rev. 00 Pag. 37 di 47 A.3. Conclusioni I metodi con risultati qualitativi aumenteranno la loro diffusione sia nei laboratori di prova che nei laboratori medici, nonché in molte situazioni esterne ai laboratori (cliniche e non) in cui sia necessario ottenere rapidamente risultati utili per le decisioni da prendere. L'espressione qualitativa dei risultati rende meno immediata l'applicazione dei concetti fondamentali di metrologia concernenti le determinazioni di variabilità, incertezza di misura, ripetibilità, riproducibilità, nonché le verifiche con prove ripetute, in doppio o superiori. La difficoltà ha indotto taluno, anche recentemente [A2LA et al., 2007], a considerare la stima dell'incertezza di questi metodi un esercizio privo di significato. Tuttavia, si riconosce da più parti che la definizione della problematica dei metodi con risultati interpretativi o qualitativi è assolutamente necessaria [ENFSI.., 2006]. Si è costituito infatti nel tempo un corpus di conoscenze abbastanza robusto per consentire un approccio rigoroso alla variabilità dei metodi qualitativi. Innanzitutto, è necessario utilizzare quando disponibili le misure quantitative, come variabili d'ingresso, ogni qual volta il risultato qualitativo, positivo-negativo, sia il risultato di una interpretazione basata su livelli soglia e intervalli decisionali. Quando invece il risultato qualitativo è l'unica informazione disponibile, occorre stimare l'intervallo di variabilità tra due punti significativi per l'importanza degli errori, ad esempio le concentrazioni al 5% ed al 95% dei risultati positivi. Attualmente sia i produttori di metodi di laboratorio che gli utilizzatori non sono familiari con questo approccio e possono mancare loro alcuni strumenti necessari, come ad esempio la stima indipendente dei livelli di concentrazione nei campioni di prova o l'intervallo di incertezza accettabile per l'uso previsto dell'esame diagnostico. Per questo è ragionevole prevedere un periodo di sperimentazione, progressivamente sempre più estesa ed approfondita, che consenta di accumulare le conoscenze e le esperienze necessarie. DOCUMENTI TECNICI Data: 2013-02-06 DT-07-DL/DS rev. 00 Pag. 38 di 47 Appendice B. Definizioni da CLSI EP12-A2 (2007) e documento Accredia RT08_rev02 (11-09-2012) Ai fini del presente documento si applicano i termini e le definizioni seguenti. Prova: Determinazione di una o più caratteristiche di un oggetto di valutazione della conformità, secondo una procedura [RT08 rev02, 3.1.3]. Tecnica di prova: Tecnica che individua il principio su cui si fonda il metodo di prova [RT08 rev02, 3.1.5]. Metodo di prova: Procedura tecnica specificata per eseguire una prova [RT08 rev02, 3.1.6]. Riferibilità metrologica: proprietà di un risultato di misura per cui esso è posto in relazione a un riferimento attraverso una documentata catena ininterrotta di tarature, ciascuna delle quali contribuisce allʼincertezza di misura [VIM 3rd Edition, UNI CEI 70099: 2008, 2.41]. Accuratezza: Grado di concordanza tra un risultato di una prova e il valore di riferimento accettato [UNI ISO 5725-1:2004, 3.6], oppure: Grado di concordanza tra un valore misurato e un valore vero di un misurando [VIM 3rd Edition, UNI CEI 70099: 2008, 2.13]. Scostamento sistematico (bias): Differenza tra la speranza matematica dei risultati di prova ed un valore di riferimento accettato [UNI ISO 5725-1:2004, 3.8], oppure: Stima di un errore di misura sistematico [VIM 3rd Edition, UNI CEI 70099: 2008, 2.18]. Precisione: Grado di concordanza fra risultati di prova indipendenti ottenuti nelle condizioni stabilite [UNI ISO 5725-1-1:2004, 3.12], oppure: Grado di concordanza tra indicazioni o valori misurati ottenuti da un certo numero di misurazioni ripetute dello stesso oggetto o di oggetti similari, eseguite in condizioni specificate [VIM 3rd Edition, UNI CEI 70099: 2008, 2.15]. Ripetibilità: Precisione in condizioni di ripetibilità [UNI ISO 5725-1:2004, 3.13] e [VIM 3rd Edition, UNI CEI 70099: 2008, 2.21]. Condizioni di ripetibilità: Condizioni nelle quali risultati di prova indipendenti sono ottenuti con lo stesso metodo su un identico materiale, nello stesso laboratorio, dallo stesso operatore, usando la stessa apparecchiatura e in intervalli di tempo brevi [UNI ISO 5725-1:2004, 3.14], oppure: Condizione di una misurazione che assicura: la medesima procedura di misura, lo stesso luogo e l’esecuzione di misurazioni ripetute dello stesso oggetto, o di oggetti simili, in un intervallo di tempo esteso; la conDOCUMENTI TECNICI Data: 2013-02-06 DT-07-DL/DS rev. 00 Pag. 39 di 47 dizione può invece includere altri elementi che potrebbero variare [VIM 3rd Edition, UNI CEI 70099: 2008, 2.22]. Riproducibilità: Precisione in condizioni di riproducibilità [UNI ISO 5725-1:2004, 3.17] e [VIM 3rd Edition, UNI CEI 70099: 2008, 2.25]. Condizioni di riproducibilità: Condizioni nelle quali i risultati di prova vengono ottenuti con lo stesso metodo su entità di prova identiche, in laboratori differenti, con diversi operatori e usando apparecchiature diverse [UNI ISO 5725-1:2004, 3.18], oppure: Condizione di una misurazione, che assicura: differenti luoghi, operatori e sistemi di misura, e l’esecuzione di misurazioni ripetute dello stesso oggetto, o di oggetti simili [VIM 3rd Edition, UNI CEI 70099: 2008, 2.24]. NOTA: Differenti sistemi di misura possono far uso di differenti procedure di misura. In chimica la condizione di riproducibilità non comprende la variazione della procedura. Incertezza di misura: Parametro, associato al risultato di una misurazione, che caratterizza la dispersione dei valori ragionevolmente attribuibili al misurando [UNI CEI ENV 13005:2000, 2.23), oppure: Parametro non negativo che caratterizza la dispersione dei valori che sono attribuiti a un misurando, sulla base delle informazioni utilizzate [VIM 3rd Edition, UNI CEI 70099: 2008, 2.26]. NOTA: Il parametro può essere ad esempio uno scarto tipo (o un suo multiplo dato) o la semiampiezza di un intervallo che abbia un livello di fiducia stabilito. Analita: componente rappresentato nelle denominazione di una grandezza misurabile [UNI EN ISO 17511:2004, 3.2]. NOTA: Termine sconsigliato da [VIM 3rd Edition, UNI CEI 70099: 2008, 2.3]. Condizione di interesse; condizione obiettivo [CLSI EP12]: particolare malattia, stadio di malattia, stato di salute o qualsiasi altra condizione identificabile o caratteristica interessante, come ad esempio lo stadio di una malattia già nota o una condizione di salute che comporti una immediata azione clinica, come l'avvio, la modifica o l'interruzione di un trattamento. Controllo [CLSI EP12]; materiale di controllo: dispositivo, soluzione o preparato liofilizzato destinato ad essere utilizzato nel processo di controllo di qualità NOTA 1 La reazione o concentrazione attesa degli analiti di interesse è nota entro i limiti accertati durante la preparazione e confermati prima dell'utilizzo. NOTA 2 I materiali di controllo generalmente non sono utilizzati per la taratura nello stesso processo in cui sono utilizzati come controllo. Cut-off [CLSI EP12]: per una prova qualitativa, la soglia sopra la quale il risultato è riportato come positivo e sotto la quale il risultato è riportato come negativo. NOTA La concentrazione di cut-off identificata in questo documento come C50 è la concentrazione di analitica in cui il 50% di una numerosa serie di risultati sono positivi. DOCUMENTI TECNICI Data: 2013-02-06 DT-07-DL/DS rev. 00 Pag. 40 di 47 Standard di riferimento stabilito [CLSI EP12] – il miglior metodo disponibile per stabilire la presenza o lʼassenza della condizione o della caratteristica di interesse. NOTA 1: Lo Standard di riferimento stabilito può essere una singola prova o un metodo, o una combinazione di metodi e tecniche, compreso il monitoraggio (followup) clinico (modificata da STARD). NOTA 2: La parola “stabilito” (“designated”) è stata aggiunta al termine per sottolineare che lo standard di riferimento (come definito da STARD) evolverà con lʼavanzamento dei sistemi analitici e potrà essere in certe situazioni differente da uno standard di riferimento determinato da un ente regolatorio o metrologico. NOTA 3: Uno Standard di riferimento stabilito divide la popolazione per la quale è inteso solo in due gruppi e non considera lʼesito della prova candidata (la nuova prova in valutazione). Uno Standard di riferimento stabilito può essere una combinazione di metodi dove lo standard è lʼalgoritmo che specifica la selezione e la sequenza di questi metodi e come I differenti risultati sono combinati per fornire una classificazine finale positive/negativo. NOTA 4: La definizione VIM93 per riferimento è differente, ovvero è espressa come uno standard che generalmente possiede la più elevata qualità metrologica in un dato contesto o in una certa organizzazione da cui sono derivate le misurazioni. Accuratezza diagnostica: Grado di concordanza tra le informazioni dalla prova in valutazione e lo standard di riferimento stabilito (modificata da STARD). NOTA 1: L'accuratezza diagnostica può essere espressa in modi differenti, compreso le coppie sensibilità - specificità diagnostiche, le coppie del quoziente di probabilità e l'area sotto la curva caratteristica operativa (ROC). NOTA 2: L'accuratezza diagnostica deve essere interpretata nel contesto con le condizioni di interesse e/o lo standard di riferimento stabilito. NOTA 3: Lʼaccuratezza diagnostica è differente accuratezza, che è la vicinanza del singolo risultato di misura al valore (convenzionale) di riferimento [UNI ISO 5725: 2004]. Sensibilità diagnostica: Percentuale (frazione numerica moltiplicata per 100) di soggetti nelle condizioni obiettivo (come determinate dallo standard di riferimento stabilito) il cui valore di prova è positivo. NOTA 1: Talora “Sensibilità diagnostica ” viene riferita ad una sola condizione clinica, mentre il concetto di condizione obiettivo ne può comprendere diverse. NOTA 2: La condizione o caratteristica di interesse deve essere definita da criteri indipendenti. NOTA 3 Una stima della sensibilità diagnostica è calcolata come 100*TP/(TP+FN). Specificità diagnostica: Percentuale (frazione numerica moltiplicata per 100) di soggetti privi della condizione obiettivo (come determinata dallo standard di riferimento stabilito) il cui valore di prova è negativo. NOTA 1 Talora “specificità diagnostica ” viene riferita ad una sola condizione clinica, mentre il concetto di condizione obiettivo ne può comprendere diverse. DOCUMENTI TECNICI Data: 2013-02-06 DT-07-DL/DS rev. 00 Pag. 41 di 47 NOTA 2 La condizione o caratteristica di interesse deve essere definita da criteri indipendenti. NOTA 3 Una stima della specificità diagnostica è calcolata come 100*TN/(FP+TN). Efficienza: Percentuale (frazione numerica moltiplicata per 100) di risultati che sono veri (corretti) , sia positivi che negativi; NOTA: una stima della efficienza è calcolata come 100×(TP+TN)/(TP+FP+FN+TN). Risultato falso negativo // falso negativo: Risultato di prova negativo per un soggetto in cui la condizione di interesse è presente (come determinate dallo standard di riferimento stabilito). Risultato falso positivo // falso positivo: Risultato di prova positivo per un soggetto in cui la condizione di interesse è assente (come determinate dallo standard di riferimento stabilito). FN: Numero di risultati falsi negativi. FP: Numero di risultati falsi positivi. Limite del bianco (LoB): Risultato di misura più elevato che si può osservare (con una probabilità definita) per un campione bianco. NOTA 1 LoB non è una concentrazione reale di cui si ottengono misure; infatti, la concentrazione reale a cui si garantisce un segnale positivo è chiamata limite di rilevazione. Parimenti, LoB è il valore atteso più basso per un campione che contiene un livello di analita uguale a LoD con probabilità stabilita. NOTA 2: Corrisponde al termine “limite inferiore di determinazione”; il risultato più basso ottenuto da una procedura definita di misura che può essere data con una certa incertezza. NOTA 3 Altrimenti detto “valore critico” (UNI ISO 11843: 2009). Limite di rivelazione (limit of detection, LoD): La più piccola quantità di analita in un campione che può essere rivelata con una (stabilta) probabilità, sebbene forse non quantificata come un valore esatto (modificata da WHO-BS/95.1793). Misurando: Grandezza che sʼintende misurare [VIM 3rd Edition, UNI CEI 70099: 2008, 2.3]. Valore predittivo di un risultato negativo // valore predittivo negativo (NPV): Percentuale (frazione numerica moltiplicata per 100) dei soggetti con un risultato di prova negativo che non hanno la condizione obiettivo (come determinata dallo standard di riferimento stabilito) NOTA 1: NPV deve essere interpretato nel contesto con la prevalenza della condizione di interesse (come determinata dallo standard di riferimento stabilito). NOTA 2: Una stima di NPV [con prevalenza stimata uguale a 100×(TP+FN)/(TP+FP+FN+TN)] è calcolata come 100xTN/(TN+FN). DOCUMENTI TECNICI Data: 2013-02-06 DT-07-DL/DS rev. 00 Pag. 42 di 47 Valore predittivo di un risultato positivo // valore predittivo positivo (PPV): Percentuale (frazione numerica moltiplicata per 100) dei soggetti con un risultato di prova positivo che hanno la condizione obiettivo (come determinata dallo standard di riferimento stabilito). NOTA 1 Il termine deve essere interpretato nel contesto con la prevalenza della condizione di interesse (come determinata dallo standard di riferimento stabilito) NOTA 2 Una stima di PPV [con prevalenza stimata uguale a 100×(TP+FN)/(TP+FP+FN+TN)] è calcolata come 100xTP/(TP+FP). Prevalenza // prevalenza della condizione di interesse: La frequenza della condizione di interesse espressa come percentuale (frazione numerica moltiplicata per 100) del numero totale degli individui (quelli con la condizione più quelli senza la condizione di interesse) nella popolazione oggetto dello studio. NOTA Una stima della prevalenza è calcolata come 100×(TP+FN)/(TP+FP+FN+TN). Prove qualitative: I metodi candidati che forniscono sono due risposte categoriche (ossia, positivo/negativo o si/no). NOTA 1 Alcune prove qualitative non hanno valori numerici associati ai risultati; per contro, alcune prove sono classificate come qualitative perché viene riportato solo uno di due risultati (ossia positivo o negativo) ma questi risultati sono derivati dicotomizzando una scala quantitativa o ordinale. NOTA 2 Una caratteristica distintiva delle prove qualitative è che hanno solo un possibile punto decisionale medico, alla soglia cutoff. Controllo di qualità (QC):parte della gestione della qualità dedicata alla conformità ai requisiti della qualità (ISO 9000). NOTA 1 Il termine comprende le tecniche operative e le attività utilizzate per rispondere ai requisiti per la qualità. NOTA 2 Nelle prove di laboratorio in ambito medico, l'insieme di procedure progettate per sorvegliare i metodi di prova ed i risultati per assicurare prestazioni appropriate dei sistemi analitici. TN: Numero di risultati veri negativi. TP: Numero di risultati veri positivi. Popolazione obiettivo (target): Gli individui per i quali la prova è predisposta. Vero negativo // risultato vero negativo: Risultato di prova negativo per un soggetto in cui la condizione di interesse è assente. Vero positivo // risultato vero positivo: Risultato di prova positivo per un soggetto in cui la condizione di interesse è presente. DOCUMENTI TECNICI Data: 2013-02-06 DT-07-DL/DS rev. 00 Pag. 43 di 47 Appendice C. Bibliografia di riferimento A2LA. P103b – Annex: Policy on Estimating Measurement Uncertainty for Life Sciences Testing Labs. Date of Issue 18/10/2007. B.M. Simonet. Quality control in qualitative analysis. TrAC Trends in Analytical Chemistry. Volume 24, Issue 6, June 2005, Pages 525-531. BIPM, IEC, IFCC, ISO, ILAC, IUPAC, IUPAP, OIML (2007) International vocabulary of metrology—Basic and general concepts and associated terms. Vocabulaire international de me´trologie—Concepts fondamentaux et ge´ne´raux et termes associe´s, 3rd edn. Draft JCGM, Se`vres (abbreviated VIM3) Bottazzini N. Il controllo e l'espressione dei risultati delle prove microbiologiche. Seminario SINAL Novembre 2000. C-NPU. Subcommittee on Nomenclature, Properties, and Units in Laboratory Medicine. Available from: URL: http://www.iupac.org/divisions/VII/VII.C.1/. Caslavska J, Allemann D and Thormann W. Analysis of urinary drugs of abuse by a multianalyte capillary electrophoretic immunoassay. Journal of Chromatography A, Volume 838, Issues 1-2, 9 April 1999, Pages 197-211. CEN/TC 251. EN 1614:2006 Health Informatics — Representation of dedicated kinds of property in laboratory medicine. Chinaka S, Iio R, Takayama N, Kodama S, and Hayakawac K. Chiral Capillary Electrophoresis of Amphetamine-Type Stimulants. Journal of Health Science, 52(6) 649–654 (2006). Clinical and Laboratory Standards Institute. User Protocol for Evaluation of Qualitative Test Performance; Approved Guideline—Second Edition. CLSI document EP12-A2 [ISBN 1-56238-000-0]. Clinical and Laboratory Standards Institute, 940 West Valley Road, Suite 1400, Wayne, Pennsylvania 19087-1898 USA, 2007. Dybkaer R, Jørgensen K. Measurement, value, and scale. Scand J Clin Lab Invest Suppl. 1989;194:69-76. Dybkaer R. An Ontology on Property for physical, chemical, and biological systems. Thesis. APMIS. 2004; 112(Suppl. no. 117):1–210. DOCUMENTI TECNICI Data: 2013-02-06 DT-07-DL/DS rev. 00 Pag. 44 di 47 Dybkaer R. Metrology and protometrology: the ordinal question. Accred Qual Assur (2007) 12:553–557. Dybkaer R. Scales for measurement based on an antigen-antibody reaction. Scand J Clin Lab Invest Suppl. 1991;205:55-62. EA - 4/10 — Accreditation in Microbiological Laboratories. July 2002 rev02. EA 4/16 EA guidelines on the expression of uncertainty in quantitative testing. December 2003 rev00. Ellison SLR, Gregory S and Hardcastle WA. Quantifying uncertainty in qualitative analysis. Analyst, May 1998, Vol. 123 (1155–1161). Ellison SLR. Uncertainties in qualitative testing and analysis. Accred Qual Assur (2000) 5:346–348 ENFSI. Standing Committee for Quality and Competence (QCC). Guidance for uncertainty of measurement in quantitative analyses or testing (UM). BPM QCC-UM001. Issue NO: 001. 4 November 2006. EURACHEM/CITAC Guide: The Expression of Uncertainty in Qualitative Testing, Committee Draft September 2003. EURACHEM/CITAC Guide. Quantifying Uncertainty in Analytical Measurement. Second edition 2000. EURACHEM/CITAC joint working group on http://www.eurachem.org/wgs/wg_qa.htm. Qualitative Analysis Garcinuño RM, Fernández P, Pérez-Conde C, Gutiérrez AM, Cámara C. Development of a fluoroimmunosensor for theophylline using immobilised antibody. Talanta. 2000 Aug 16;52(5):825-32. Giraud S, Robinson N, Mangin P, Saugy M. Scientific and forensic standards for homologous blood transfusion anti-doping analyses. Forensic Science International 179 (2008) 23–33. Grimaldi R. Corso di Metodologia della Ricerca Sociale. I livelli di scala. http://www.cisi.unito.it/progetti/leda/cap3a.htm. Iio R, Chinaka S, Takayama N, and Hayakawa K. Simultaneous Chiral Analysis of Methamphetamine and Related. Compounds by Capillary Electrophoresis/Mass DOCUMENTI TECNICI Data: 2013-02-06 DT-07-DL/DS rev. 00 Pag. 45 di 47 Spectrometry Using Anionic Cyclodextrin. Analytical Sciences. January 2005, 2005;21:15-9. Istituto Superiore di Sanità. Quantificazione dellʼincertezza nelle misure analitiche. Seconda edizione (2000) della Guida EURACHEM / CITAC CG 4. Traduzione italiana a cura di Marina Patriarca, Ferdinando Chiodo, Federica Corsetti, Barbara Rossi, Antonio Menditto, Michela Sega e Margherita Plassa 2003, vi, 119 p. Rapporti ISTISAN 03/30. Jarvis B, Corry J.E.L. and Hedges A.J.. Estimates of measurement uncertainty from proficiency testing schemes, internal laboratory quality monitoring and during routine enforcement examination of foods. of Applied Microbiology 103 (2007) 462– 467. Lombard B. Estimation of measurement uncertainty in food microbiology: The ISO approach. Accred Qual Assur (2006) 17: 94–100. MEQUALAN.Straight answers from qualitative chemical http://ec.europa.eu/research/growth/gcc/projects/mequalan.html. analysis Pulido A Ruisanchez AI, Boqué R, Rius FX, Analytica Chimica Acta, 455 (2002) 267-275. Rapillo M. Gli scarti..."tipi"...facili. Dove si narra dell' utilizzo di excel per il calcolo della ripetibilità e dell' incertezza delle misure variabili con la concentrazione. Gangemi: 2008. Ríos1 A., Barceló D, Buydens L, S. Cárdenas S, Heydorn K, Karlberg B, Klemm K, Lendl B, Milman B, Neidhart B, Stephany RW, Townshend1 A, Zschunke A and Valcárcel1 M. Quality assurance of qualitative analysis in the framework of the European project ʼMEQUALANʼ . Accreditation and Quality Assurance: Journal for Quality, Comparability and Reliability in Chemical Measurement. Volume 8, Number 2 / February, 2003 Pages 68-77. S.L.R. Ellison, a, and T. Fearna. Characterising the performance of qualitative analytical methods: Statistics and terminology. TrAC Trends in Analytical Chemistry. Volume 24, Issue 6, June 2005, Pages 468-476. Sanford J. Doping of Racehorses. Br J Sports Med.1974; 8: 176-180. SINAL DT-0002, Guida per la valutazione e lʼespressione dellʼincertezza nelle misurazioni. Rev.1, febbraio 2000. STARD. Standards for the Reporting of Diagnostic accuracy studies. http://stardstatement.org/ . Last update 22 April 2008. DOCUMENTI TECNICI Data: 2013-02-06 DT-07-DL/DS rev. 00 Pag. 46 di 47 Stevens S.S. On the Theory of Scales of Measurement. Science 7 June 1946: Vol. 103. no. 2684, pp. 677 – 680. DOI: 10.1126/science.103.2684.677. United States Equestrian Federation®. Equine Drugs and Medications Program. 3760 Ridge Mill Drive, Hilliard, Ohio 43026. Drugs and medications guidelines. Last revised august 1, 2007. WADA . Harmonization of the method for the identification of epoetin alfa and beta (rEPO) and darbepoetin alfa (NESP) by ief-double blotting and chemiluminescent detection. WADA Technical Document – TD2007EPO. Wayne Dimech1,a, Barbara Francis1, Jennifer Kox2, Graham Roberts2 for the Serology Uncertainty of Measurement Working Party . Calculating Uncertainty of Measurement for Serology Assays by Use of Precision and Bias. Clinical Chemistry. 2006;52:526-529. DOCUMENTI TECNICI Data: 2013-02-06 DT-07-DL/DS rev. 00 Pag. 47 di 47