Titolo/Title
Guida allʼesecuzione di prove con risultati qualitativi
Guide to perform tests with qualitative results
Sigla/Reference
DT-07-DL/DS
Revisione/Revision
00
Data/Date
06/02/2013
Redazione
Approvazione
Autorizzazione allʼemissione
Entrata in vigore
Il Membro Relatore competente
I Direttori di Dipartimento
Il Direttore Generale
18-03-2013
Il presente documento è di proprietà di ACCREDIA e non può essere riprodotto o diffuso in parte o per intero, se
non dietro autorizzazione scritta del Direttore Generale.
DOCUMENTI TECNICI
Data: 2013-02-06
DT-07-DL/DS rev. 00
Pag. 1 di 47
Guida all’esecuzione di prove con risultati qualitativi
(Misura ciò che è misurabile e rendi misurabile ciò che non lo è - Galileo Galilei)
Indice
0. Premessa .............................................................................................................................. 3
1. Introduzione .......................................................................................................................... 5
2. Tabelle di contingenza ......................................................................................................... 6
3. Il teorema di Bayes ............................................................................................................... 8
3.1. MODALITÀ DI COMBINAZIONE DEGLI ESITI DI PROVE SUCCESSIVE ................................... 12
3.2. VALUTAZIONE DELLE PROBABILITÀ DI RISPOSTE FALSE ................................................... 15
3.2.1 Valutazione a partire dalla distribuzione nota delle risposte...................................... 15
3.2.2 Valutazione a partire dalla esecuzione di una lunga serie di misurazioni ................. 20
3.3. APPLICAZIONI DEL TEOREMA DI BAYES ............................................................................ 21
3.4. CONCLUSIONI PER IL TEOREMA DI BAYES ........................................................................ 22
4. Metodo degli intervalli statistici ........................................................................................ 25
5. Le curve di potenza ............................................................................................................ 28
6. Conclusioni ......................................................................................................................... 30
Appendice A. Indicazioni pratiche - CLSI EP12 e MEQUALAN .......................................... 31
A.1. VARIABILITÀ DEI RISULTATI QUALITATIVI. CLSI EP12 E MEQUALAN ............................... 31
A.1.1 CLSI-EP12 - Evaluation of Qualitative Test Performance......................................... 31
A.1.2 Progetto MEQUALAN .............................................................................................. 33
A.2 CASI D'USO ........................................................................................................................ 35
A.3. CONCLUSIONI.................................................................................................................... 38
Appendice B. Definizioni da CLSI EP12-A2 (2007) e documento Accredia
RT08_rev02 (11-09-2012) ........................................................................................................ 39
Appendice C. Bibliografia di riferimento .............................................................................. 44
DOCUMENTI TECNICI
Data: 2013-02-06
DT-07-DL/DS rev. 00
Pag. 2 di 47
0. Premessa
I requisiti generali per l'accreditamento dei laboratori di prova (UNI EN ISO 17025) e quelli particolari per i laboratori medici (UNI ISO 15189) fanno più volte riferimento alla incertezza dei risultati dei metodi di prova ISO 17025 5.4.5.1 “stima dell’incertezza dei risultati” ISO 15189 3.19 “parameter, associated with the result of a measurement ” Inoltre, sia ISO 17025 che ISO 15189 non fanno alcuna distinzione tra tipologie di metodi per l'applicabilità della stima di incertezza. Tuttavia, gli strumenti concettuali e pratici ad oggi disponibili per incertezza e ripetibilità sono sicuramente riferiti a risultati quantitativi, ossia espressi come valore numerico (valore misurato). Per questi le conoscenze sono consolidate e le tecniche di calcolo robuste e raffinate. Ciò ha indotto più di qualcuno a ritenere che incertezza e ripetibilità siano caratteristiche stimabili solo nel caso di risultati espressi in forma quantitativa. ISO 17025 avverte tuttavia che (Nota 3 al punto 5.4.5.3) “...La validazione è sempre un bilancio fra costi, rischi e possibilità tecniche. Vi sono molti casi in cui la gamma e l’incertezza dei valori (per esempio: l’incertezza, i limiti di rivelazione, la selettività, la linearità, la ripetibilità, la riproducibilità, la robustezza e la sensibilità incrociata alle interferenze) può essere fornita unicamente in modo semplificato a causa di mancanza di informazioni.” Ovvero, è preferibile una stima semplificata, approssimata, persino grossolana, a nessuna stima. La creazione del tutto artificiale di uno spartiacque tra metodi con risultati quantitativi e metodi con risultati qualitativi (relativi a proprietà classificatorie ed ordinali) talvolta induce in errore gli operatori, quando giungono a trascurare la componente quantitativa di metodi a cui si applica una interpretazione qualitativa. I metodi con risultati qualitativi non sono molto numerosi nei laboratori chimici e per la microbiologia ambientale o degli alimenti. Sono invece ben rappresentati nei laboratori tossicologici, forensi, veterinari e soprattutto medici. Il problema della stima delle caratteristiche di questi metodi diventa allora rilevante. DOCUMENTI TECNICI
Data: 2011-05-11
DT-?? rev. 00
Pag. 3 di 47
Questa guida è finalizzata ad aiutare i laboratori ed i produttori di sistemi analitici e reagenti ad affrontare la stima dell'incertezza di misura e la gestione della ripetibilità per i metodi che non producono risultati numerici, quantitativi. Vengono innanzitutto ripresi alcuni concetti fondamentali di calcolo delle probabilità (teorema di Bayes). Va sottolineato che questa sezione non é concepita per l'applicazione diretta nei laboratori; non tanto per la complessità apparente (più che reale) delle formule statistiche, quanto per la necessità di disporre in laboratorio di metodi adeguati di comparazione. Nelle appendici vengono invece esposte le linee guida vere e proprie per i laboratori ed i loro fornitori, ispirate soprattutto dal documento CLSI EP12 dedicato specificamente a questo argomento. È necessario anche qui sottolineare che non sempre le istruzioni qui contenute sono applicabili autonomamente dal singolo laboratorio. Anzi, è verosimile che ciò possa avvenire solo in un numero limitato di casi. Quando il laboratorio si avvale di un metodo con risultati qualitativi, infatti, lo fa appunto perché il corrispondente metodo quantitativo non é conveniente o addirittura è impraticabile. Allo stesso modo, non è facile per i laboratori disporre di materiali od oggetti di prova da sottoporre a prova con le caratteristiche adeguate. Ciò invece non si può affermare per i produttori, che hanno già l'obbligo di misurare le prestazioni dei loro metodi per ottenere il marchio CE secondo il D.lgs. 332/2000 e la Direttiva Europea sui dispositivi medico-­‐diagnostici in vitro (IVDD 98/79/EC). L'onere di produrre evidenze sull’incertezza e per la ripetibilità dei metodi, in particolare dei metodi con risultati qualitativi, ai fini dell'accreditamento, ricade quindi sia sui laboratori che sui loro fornitori, in misura sicuramente variabile da caso a caso, ma spesso prevalentemente a carico di questi ultimi. DOCUMENTI TECNICI
Data: 2013-02-06
DT-07-DL/DS rev. 00
Pag. 4 di 47
1. Introduzione
Le analisi qualitative consistono in un processo di classificazione. Oggetti o materiali di prova vengono assegnati ad una determinata classe sulla base delle risposte
ottenute attraverso le prove a cui vengono sottoposti. Per restare nel campo delle
analisi ambientali che interessa la maggior parte dei laboratori di prova e/taratura,
lʼesempio più semplice che si può fare è la catalogazione di un rifiuto in base alla
presenza o alla assenza di un dato contaminante.
La classificazione di un oggetto/materiale di prova è così un processo eseguito sulla
base di una evidenza (oggettiva) positiva o sulla mancanza di questa evidenza.
Unʼerrata classificazione può derivare da una evidenza positiva pur essendo
lʼoggetto/materiale di prova collocabile in una classe diversa (errore di primo tipo o
falso positivo), oppure una mancanza di evidenza positiva per la classe a cui
lʼoggetto/materiale di prova effettivamente appartiene (errore di secondo tipo o falso
negativo).
Per minimizzare i rischi associati ad unʼerrata classificazione, si deve esercitare
particolare cura nella validazione dei metodi analitici impiegati, se questi sono stati
messi a punto dal laboratorio, nella verifica periodica e monitoraggio delle prestazioni se tali metodi sono normalizzati o comunque ufficiali (ossia prodotti da autorità
riconosciute, ai vari livelli nazionale ed internazionale). Per esempio, se è in gioco la
presenza/assenza di una sostanza in un dato oggetto/materiale di prova, sarà importante curare lʼattendibilità del limite di rivelabilità del metodo impiegato per quella
sostanza.
Come si è accennato, la possibilità di una falsa risposta del metodo è, per sua natura, duplice. Non può, cioè, essere espressa in termini di rischio univoco; né si può
attribuire alla decisione, presa in seguito alla/e evidenza/e oggettive disponibili, un
unico livello di probabilità.
È necessario, quindi, individuare un parametro statistico che tenga conto di entrambi i rischi (di falso positivo e di falso negativo), che sia capace di riflettere il livello di
probabilità associato alla decisione presa, che sia in grado di aggiornare il proprio
valore sulla base di ulteriori informazioni derivanti dalle risposte dovute
allʼapplicazione successiva di altre prove e/o metodi. Altre caratteristiche desiderabili per questo parametro sono quelle derivanti dalla mancanza di ambiguità, dalla
facilità di calcolo e di espressione e da una larga convergenza sul relativo utilizzo.
Il presente documento non ha la pretesa di trattare tutti i metodi finalizzati alla espressione dellʼincertezza per risultati qualitativi. Nel seguito ne sono presentati
quattro, ritenuti tra quelli maggiormente utilizzati:
− Tabelle di contingenza;
− Teorema di Bayes;
− Intervalli statistici;
− Curve di prestazione o di potenza.
DOCUMENTI TECNICI
Data: 2013-02-06
DT-07-DL/DS rev. 00
Pag. 5 di 47
I primi due trattano lʼincertezza come un problema di classificazione mentre la procedura basata sugli intervalli statistici calcola lʼincertezza in modo simile a quello
usato nelle analisi quantitative. Infine, il metodo basato sulle curve di prestazione è
generalmente applicabile a tutte le prove di screening.
Tutte queste metodologie presentano vantaggi e svantaggi e devono essere accuratamente valutati dal laboratorio con particolare riferimento alla caso specifico di
relativo utilizzo.
2. Tabelle di contingenza
Le tabelle di contingenza trattano le analisi qualitative come un problema di classificazione, per esempio quando i risultati di una prova sono utilizzati per sapere se si
trovano sopra o sotto il livello di un valore specifico di riferimento (per esempio, limite di legge). Il risultato quindi può essere positivo (i.e. sopra o uguale al valore di riferimento specificato) o negativo (i.e. sotto il valore di riferimento specificato).
Tipicamente si prendono in considerazione solo 2 possibili esiti (p) e due possibili
situazioni reali (n) e dunque si può costruire una tabella di contingenza 2x2 (nxp).
Le dimensioni della tabella sono ovviamente funzione del numero di categorie attese.
ESEMPIO 1
Abbiamo un metodo che permette di rilevare la presenza assenza di aflatossine negli alimenti al livello di 2 µg/g che è il limite legale. Si utilizza un kit commerciale che
è basato sul cambiamento di colore quando la concentrazione di aflatossine è superiore al limite legale.
Si preparano 300 campioni di cui 150 hanno un livello di aflatossine superiore al
limite di legge e 150 un limite inferiore a quello di legge come confermato da una
parallela analisi mediante HPLC. Si applica quindi il test.
Si possono verificare 4 casi:
- una risposta negativa del test che conferma quella reale;
- una risposta positiva del test che conferma quella reale;
- una risposta positiva del test in disaccordo con quella reale;
- una risposta negativa del test in disaccordo con quella reale.
Si inseriscono i dati in tabella di contingenza e si ha il seguente prospetto:
Situazione reale
Risultato
del test
Sopra o
uguale al limite
Sotto il limite
Totali
(a+b) e (c+d)
positivo
(a)
(b)
a+b
negativo
(c)
(d)
c+d
Totali
(a+c)
(b+d)
a+b + c +d
DOCUMENTI TECNICI
Data: 2013-02-06
DT-07-DL/DS rev. 00
Pag. 6 di 47
Situazione reale
Sopra o uguale al limite
Sotto il limite
Totali
(a+b) e (c+d)
positivo
125 (a)
20 (b)
145
negativo
25 (c)
130 (d)
155
Totali
(a+c) e (b+d)
150
150
300
Risultato
del test
Dal quale posso calcolare:
Sensibilità = a /a+c
Specificità = d/b+d
Quantità di falsi negativi = c/a+c
Quantità di falsi positivi = b/b+d
Valori predittivi positivi = a/a+b
Valori predittivi negativi = d/c+d
ottenendo:
Sensibilità =
0,83
Specificità = 0,87
Quantità di falsi negativi = 0,17
Quantità di falsi positivi = 0,13
Valori predittivi positivi = 0,86
Valori predittivi negativi = 0,84
Le tabelle di contingenza sono spesso usate per valutare lʼattendibilità dei test di
screening o per comparare due test (esempio: test di Mc Nemar). Questi confronti
sono basati sulla sensibilità e specificità dei due test quando applicati agli stessi
campioni.
Uno dei vantaggi delle tabelle di contingenza è che sono di validità generale e possono essere applicate a molti test biologici. Comunque, particolare attenzione deve
essere posta alla terminologia in quanto i termini sensibilità e specificità hanno un
diverso significato rispetto ai metodi quantitativi. Infatti, la specificità viene definita
come la proporzione di negativi veri rispetto al numero totale di negativi reali e la
sensibilità come la proporzione di positivi veri rispetto al numero totale di positivi.
DOCUMENTI TECNICI
Data: 2013-02-06
DT-07-DL/DS rev. 00
Pag. 7 di 47
Le tabelle di contingenza danno unʼidea delle performance totale di un test ma non
possono stimare la probabilità di commettere un errore su un singolo campione.
Un altro problema per le tabelle di contingenza è che esse dipendono grandemente
dal numero di campioni esaminati (numerosità del campione).
Le tabelle di contingenza sono molto utilizzate per la valutazione di test
immunologici e microbiologici e studi clinici.
3. Il teorema di Bayes
Il teorema di Bayes fornisce un metodo per perfezionare la stima della probabilità di
un evento quando si rendono disponibili altre informazioni che riguardano quello
stesso evento.
La forma più utile allo scopo del presente documento è data dalla seguente formula:
P(e / A) ! P( A)
P ( A / e) =
(1)
P(e / A) ! P( A) + P(e / ¬A) ! P(¬A)
dove:
P(A /e) è la probabilità della presenza di A dato lʼevento e;
P(A) è la probabilità “a priori” della presenza di A;
P(¬A) è la probabilità “a priori” dellʼassenza di A;
!
!
P(e / A) è la probabilità dellʼevento e data la presenza di A;
P(e / ¬A) è la probabilità dellʼevento e data lʼassenza di A, cioè la probabilità di un
falso positivo.
Se si vuole dare ai simboli significati comprensibili a chi esegue lʼanalisi, allora con
A si può denotare la presenza dellʼanalita di interesse, con ¬ A la sua assenza; con
e la risposta positiva del test, con ¬ e la risposta negativa. Così, per mezzo di P(A)
possiamo indicare la probabilità che lʼanalita sia presente prima di eseguire il test e
con P(¬A) la probabilità che sia assente. Siccome questi due eventi si escludono
mutuamente e coprono perciò tutte le possibilità, si può scrivere:
P ( A) + P (¬A) = 1
(2)
Inoltre, P(¬e / A) è la probabilità di osservare un esito negativo, ¬ e, del test quando
lʼanalita A è presente (falso negativo), P(e / A) è la probabilità di osservare lʼesito
positivo, e, del test se lʼanalita A è presente (come è già stata definita sopra);
P(¬e / ¬A) è la probabilità di osservare un esito negativo, ¬e , del test se lʼanalita A
è assente, P(e / ¬A) è la probabilità di osservare un esito positivo, e, del test quando
lʼanalita A è assente (falso positivo, come già è stata definita sopra).
Relazioni analoghe alla (2) valgono, ovviamente, anche per queste due copie che si
escludono mutuamente. Si ha pertanto:
P(¬e / A) + P(e / A) = 1
(2a)
P(¬e / ¬A) + P(e / ¬A) = 1
(2b)
DOCUMENTI TECNICI
Data: 2013-02-06
DT-07-DL/DS rev. 00
Pag. 8 di 47
Nella comune pratica analitica, se il risultato, e, del test è positivo, allora P(e / A) è
prossima ad 1 a meno di essere in vicinanza del limite di rivelabilità. Infatti, dalla
(2a) si ha: P(e / A) = 1 ! P(¬e / A) .
Quindi, lʼequazione (1) combinata con la (2a) permette di tener conto di entrambe le
probabilità di falso positivo e di falso negativo per stabilire quale sia ora la probabilità della presenza dellʼanalita A dato lʼesito positivo, e, del test .
Esempio 1
Si supponga di voler stabilire la presenza dellʼanalita A in un materiale mediante un
test o metodo che ha una percentuale di falsi positivi del 3%, cioè: P(e / ¬A) = 0,03 e
una percentuale di falsi negativi dello 1%, cioè: P(¬e / A) = 0,01 , dati relativi alle caratteristiche del metodo ricavati dagli studi di validazione. In mancanza di informazioni circa la presenza o lʼassenza di A nel materiale da esaminare, lʼipotesi più
plausibile e semplice è che esse siano equiprobabili, cioè: P( A) = P(¬A) = 0,5 . Quale è ora la probabilità “a posteriori”, P(A/e), da attribuire alla presenza di A se il risultato del test, e, è positivo?
Tenendo conto della (2a), lʼequazione (1) diventa:
P ( A / e) =
[1 " P(¬e / A)]! P( A)
[1 " P(¬e / A)]! P( A) + P(e / ¬A) ! P(¬A)
(3)
Sostituendo i valori noti, si ha:
(1 " 0,01) ! 0,5
0,495
P ( A / e) =
=
= 0,9706
(1 " 0,01) ! 0,5 + 0,03 ! 0,5 0,495 + 0,015
Come si vede, il livello di probabilità “a posteriori” riguardante la presenza di A è
molto aumentato rispetto a quello “a priori” rispecchiando la maggior sicurezza che
si ha sulla presenza dellʼanalita A in seguito allʼesito positivo del test.
Se il risultato del test fosse stato negativo, ¬e , quale sarebbe stato la probabilità “a
posteriori” P( A / ¬e) della presenza dellʼanalita A ?
Il risultato negativo del test non è sufficiente per provare lʼassenza dellʼanalita A. Bisogna infatti tener conto della possibilità di falso negativo. La probabilità P( A / ¬e) si
calcola sostituendo nellʼequazione (1) e con ¬e e tenendo conto della (2b). Si ottiene:
P ( A / ¬e ) =
DOCUMENTI TECNICI
Data: 2013-02-06
P(¬e / A) ! P( A)
P(¬e / A) ! P( A) + [1 " P(e / ¬A)]! P(¬A)
DT-07-DL/DS rev. 00
(4)
Pag. 9 di 47
Sostituendo in questa espressione i valori noti, si ha:
0,01 ! 0,5
P( A / ¬e) =
= 0,0102
0,01 ! 0,5 + (1 " 0,03) ! 0,5
Naturalmente, se si è in possesso di informazioni che permettono di stabilire una
probabilità “a priori” maggiore di 0,5 riguardante la presenza dellʼanalita A, per esempio, P(A) = 0,95 e quindi P(¬A) = 0,05, allora sempre applicando la (1) insieme
alla (2a), si ricava:
(1 " 0,01) ! 0,95
0,9405
P ( A / e) =
=
= 0,9984
(1 " 0,01) ! 0,95 + 0,03 ! 0,05 0,9405 + 0,0015
Lʼeffetto del risultato positivo del test aumenta comunque la già alta probabilità della
presenza dellʼanalita A.
Tuttavia, per diverse ragioni, fra le quali non ultima quella di non disporre dello “storico” riguardante il processo in esame, si preferisce spesso attribuire una equiprobabilità alla presenza o assenza di un analita A, cioè: P(A) = P(¬A) = 0,5. Il teorema
di Bayes offre un modo semplice per trattare questa frequente eventualità. Infatti,
può essere espresso anche con una formula alternativa alla (1) con la quale si calcola la probabilità di assenza dellʼanalita A dato lʼesito positivo e del test: Si ha:
P(e / ¬A) ! P(¬A)
P ( ¬A / e ) =
(5)
P(e / A) ! P( A) + P(e / ¬A) ! P(¬A)
Se ora si divide lʼespressione (1) con lʼespressione (5), si ottiene:
P ( A / e)
P(e / A)
P( A)
=
!
P(¬A / e) P(e / ¬A) P(¬A)
(6)
Questa è la forma del teorema di Bayes espresso con i rapporti di probabilità
(odds). La parte sinistra dellʼequazione descrive il rapporto di probabilità “a posteriori” sulla presenza /assenza dellʼanalita A dato lʼesito positivo, e, del test e si denota
con O(A/e), cioè:
P ( A / e)
O ( A / e) =
(6a)
P ( ¬A / e )
Nella parte destra dellʼequazione, P(A)/ P(¬A) , è pure un rapporto di probabilità, in
questo caso “a priori”, e si denomina con O(A), cioè:
P( A)
O( A) =
(6b)
P(¬A)
mentre, P(e / A) / P(e / ¬A) è noto come rapporto di verosimiglianza, denominato LR,
cioè:
P(e / A) 1 ! P(¬e / A)
LR =
=
(6c)
P(e / ¬A)
P(e / ¬A)
DOCUMENTI TECNICI
Data: 2013-02-06
DT-07-DL/DS rev. 00
Pag. 10 di 47
In definitiva, lʼespressione (6) può essere riscritta più semplicemente tenendo conto
delle (6a), (6b) e (6c) nel modo seguente:
O( A / e) = LR ! O( A)
(6d)
Quindi, per ogni prova concernente lʼanalita A che produce un esito positivo e, il
rapporto di probabilità “a posteriori”, O(A/e), è dato dal prodotto del rapporto di verosimiglianza, LR, per il rapporto di probabilità “a priori”, O(A). Ciò significa che il
rapporto di verosimiglianza dà la misura della variazione avvenuta nel rapporto di
probabilità “a priori” sulla presenza/assenza dellʼanalita A per effetto dellʼesito positivo, e, del test. Inoltre, il rapporto di verosimiglianza non dipende dal valore attribuito alla probabilità “a priori” P(A).
Infatti, se si riprendono i dati dellʼesempio 1 sopra riportato in cui: P(¬e / A) = 0,01 e
P(e / ¬A) = 0,03, si ha, tenendo della (6c):
1 ! 0,01 0,99
LR =
=
= 33
0,03
0,03
Spesso, nelle dispute forensi, si preferisce impiegare il valore di LR per giudicare
lʼattendibilità dellʼesito positivo del test. Ovviamente, maggiore è il valore di LR
maggiore è lʼattendibilità attribuita allʼesito positivo del test. Tuttavia, il valore numerico esatto di LR non viene generalmente usato in tali sedi, dove si preferisce tradurlo qualitativamente in termini di attendibilità “debole”, “buona”, forte” , molto forte”. Il valore di LR ricavato nellʼesempio in esame viene riportato come avente attendibilità collocabile a metà strada tra “debole” e “buona”.
È chiaro il motivo del frequente uso di LR. Se non è possibile attribuire un valore alla probabilità “a priori”, P(A) in base alla provenienza del campione o ad altre considerazioni, per evitare difficoltà e contestazioni spesso si preferisce porre P(A) =
P(¬A) = 0,5. In questo modo, O(A) = 1 e quindi: O( A / e) = LR . Perciò, tenendo conto della (6a) e della ovvia relazione analoga alle (2): P( A / e) + P(¬A / e) = 1 , si ricava
la seguente espressione della probabilità “a posteriori” della presenza dellʼanalita A
dato lʼesito positivo, e, del test:
LR
P ( A / e) =
(7)
1 + LR
Se ci si riferisce ancora allʼesempio 1, applicando la (7) si trova che la probabilità “a
posteriori” P(A/e) è uguale a 0,9706, valore ovviamente identico a quello già calcolato sopra applicando la (1) con la stessa condizione di P(A) = 0,5.
Il teorema di Bayes come espresso dalla (6) e dalla (7), quando P(A) = 0,5, riguarda il calcolo della probabilità “a posteriori” P(A/e), cioè la probabilità “a posteriori”
nel caso in cui lʼesito del test sia stato positivo. Ma se lʼesito fosse stato negativo,
quali sarebbero stati i valori di P( A / ¬e) e di LR ? Per ricavare tali valori, si procede
in modo del tutto analogo a quanto mostrato sopra, tenendo conto della (4) e della
seguente espressione alternativa, cioè:
DOCUMENTI TECNICI
Data: 2013-02-06
DT-07-DL/DS rev. 00
Pag. 11 di 47
P ( ¬A / ¬e ) =
P(¬e / ¬A) ! P(¬A)
P(¬e / A) ! P( A) + [1 " P(e / ¬A)]! P(¬A)
(4a)
Infatti, dividendo membro a membro la (4) con la (4a), si può ricavare la seguente
espressione del teorema di Bayes, analoga alla (6):
P ( A / ¬e )
P(¬e / A)
P( A)
=
!
P(¬A / ¬e) P(¬e / ¬A) P(¬A)
(8)
In questa espressione, si può denominare allo stesso modo:
P(¬e / A)
P(¬e / A)
LR =
=
P(¬e / ¬A) 1 ! P(e / ¬A)
Se si è ipotizzato: P(A) = P(¬A) = 0,5, si ha:
P ( A / ¬e ) =
LR
1 + LR
(8a)
(8b)
Se si suppone, nellʼesempio 1, che lʼesito del test sia stato negativo, cioè: ¬e , allora sostituendo nella (8a):
0,01
LR =
= 0,0103
1 ! 0,03
Sostituendo il valore di LR nella formula (8b), si ottiene:
0,0103
P( A / ¬e) =
= 0,0102
1 + 0,0103
Come si vede, si tratta dello stesso valore di probabilità “a posteriori” in caso di esito negativo ¬e del test già calcolato sopra utilizzando lʼespressione (4).
3.1. Modalità di combinazione degli esiti di prove successive
La forma dellʼespressione (6), così come quella dellʼespressione (8), si presta immediatamente a tener conto dellʼesito positivo, e2 , di un secondo test. Infatti, dopo
lʼesito positivo, e1 , del primo test si può scrivere:
P( A / e1 )
P(e1 / A)
P( A)
=
!
P(¬A / e1 ) P(e1 / ¬A) P(¬A)
DOCUMENTI TECNICI
Data: 2013-02-06
DT-07-DL/DS rev. 00
Pag. 12 di 47
dopo lʼesito positivo, e2 , del secondo test si potrà analogamente scrivere:
P[A /(e1 + e2 )]
P(e2 / A)
P( A / e1 )
=
!
P[¬A /(e1 + e2 )] P(e2 / ¬A) P(¬A / e1 )
ossia, si assume come probabilità “a priori” per il secondo test la probabilità “a posteriori” ricavata applicando il teorema di Bayes al primo test. Così, sostituendo
lʼespressione di tale probabilità, si ottiene:
P[A /(e1 + e2 )]
P (e2 / A)
P (e1 / A)
P ( A)
=
!
!
P[¬A /(e1 + e2 )] P (e2 / ¬A) P (e1 / ¬A) P (¬A)
(9)
Se si applicano in successione diversi test al materiale in esame per la misura
dellʼanalita A, con lo stesso modo di procedere si ottiene lʼespressione generale:
n
P[A /(e1 + e2 + ... + en )]
P(ei / A)
P( A)
="
!
P[¬A /(e1 + e2 + ... + en )] i =1 P(ei / ¬A) P(¬A)
(10)
Se si impiegano i rapporti di probabilità, questa espressione diventa:
n
O[A /(e1 + e2 + ... + en )]= " ( LR ) i ! O( A)
i =1
(11)
Come si può facilmente mostrare, lʼordine con cui vengono considerati i test
eseguiti non ha alcuna importanza.
Se si è ipotizzata lʼequiprobabilità, allora dalla (11), si ha la seguente espressione
per la probabilità “a posteriori”:
n
P[A /(e1 + e2 + ... + en )]=
! ( LR)
i
i =1
(12)
n
1 + ! ( LR ) i
i =1
Esempio 2
Si supponga di sottoporre ad esame antidoping lʼurina di un atleta per rivelare
lʼeventuale uso di una sostanza proibita attraverso la presenza di un suo metabolita.
Dopo lʼesito positivo di una prima prova, per maggiore sicurezza, si sottopone il
campione ad una seconda prova che da anchʼessa un risultato positivo.
Le caratteristiche di interesse delle due prove sono riportate nella sottostante tabella 1.
DOCUMENTI TECNICI
Data: 2013-02-06
DT-07-DL/DS rev. 00
Pag. 13 di 47
Test
1
2
Tabella 1
Probab. falso posi- Probab. falso negativo
tivo
P(e / ¬A)
P(¬e / A)
0,033
0,016
0,013
0,057
Probab. vero positivo
1 ! P(¬e / A)
0,984
0,943
Supponendo di non avere informazioni pregresse sulle abitudini dellʼatleta, si adotta
per la probabilità “a priori” lʼipotesi della equiprobabilità, cioè: P(A) = 0,5. Dopo il
primo test positivo, applicando la (6c) e poi la (7), si ottiene:
P( e1 / A ) 0,984
=
= 29 ,8 = LR1
P( e1 / ¬A ) 0,033
29,8
P( A / e1 ) =
= 0,968
1 + 29,8
Come si può apprezzare soprattutto dal valore di LR1, lʼaffidabilità che può essere
attribuita alla presenza del metabolita riscontrata nel campione dopo il primo test è
da ritenere non sufficiente. Infatti, nella classificazione dei valori di LR indicata sopra, LR1 è collocabile tra “debole” e “buono”. Si conclude, quindi, che è necessaria
lʼesecuzione di un secondo test di conferma basato su un principio chimico-fisico diverso.
Tenendo conto delle caratteristiche riportate in tabella 1 per il test 2 e applicando
ancora la (6c) e poi la (7), si ha:
P( e2 / A ) 0,943
=
= 72 ,5 = LR2
P( e2 / ¬A ) 0,013
72,5
= 0,986
1 + 72,5
Il valore di LR2 è da ritenere “buono” per se stesso ma viene molto rafforzato dal fatto di poterlo considerare insieme ad LR1. Infatti, in caso di equiprobabilità, sostituendo nella (9) e nella (12), si ha:
P ( A / e2 ) =
2
P[A /(e1 + e2 )]
= 29,8 " 72,5 = 2160,5 = ! ( LR ) i
P[¬A /(e1 + e2 )]
i =1
2160,5
P[A /(e1 + e2 )]=
= 0,9995
1 + 2160,5
DOCUMENTI TECNICI
Data: 2013-02-06
DT-07-DL/DS rev. 00
Pag. 14 di 47
2
Come si può osservare, il valore del rapporto di verosimiglianza,
! ( LR)
i
, così ot-
i =1
tenuto è molto alto e nella scala delle attendibilità sopra riportata può essere qualificato come “molto forte”. Dʼaltra parte, la probabilità “a posteriori” della presenza del
metabolita di interesse dopo lʼesito positivo del secondo test è molto vicina a 1, cioè
alla certezza.
Quindi, sfruttando la possibilità, offerta dal teorema di Bayes, di cumulare le probabilità dei risultati, si può concludere per una forte indicazione sullʼuso della sostanza
proibita.
3.2. Valutazione delle probabilità di risposte false
In senso lato, esistono due modalità per valutare le probabilità di risposte false di un
procedimento di misurazione. La prima si basa su una previsione dettata dalle caratteristiche note della distribuzione delle risposte ricavabili dal procedimento in uso.
La seconda consiste nella esecuzione di una serie, di solito molto numerosa, di misurazioni con quel procedimento, annotando le risposte diverse da quelle attese.
3.2.1 Valutazione a partire dalla distribuzione nota delle risposte
Fondamentalmente, è necessario considerare due vie. La prima concerne la consultazione della letteratura sullʼargomento. Essa potrebbe risultare utile per procedimenti riguardanti analiti di generale interesse e tecniche molto diffuse, gli uni e le altre già descritte in metodi normalizzati od ufficiali; tuttavia, il tasso di risposte false
riportate deve essere considerato con cautela e non prima di aver condotto una
soddisfacente rivalidazione delle caratteristiche principali del procedimento per accertarsi di operare in condizioni abbastanza simili a quelle riportate nei documenti
considerati. La seconda si basa sulla convalida esaustiva del procedimento e deve
essere seguita obbligatoriamente quando si tratta di un procedimento messo a punto allʼinterno del laboratorio. In particolare, i parametri essenziali da studiare per avere informazioni sulla probabilità di risposte false, oltre, ovviamente al comportamento dellʼanalita a vari livelli, sono: la matrice, la tecnica di rivelazione con
lʼassociato limite di rivelabilità, il numero di campioni da esaminare.
I meccanismi responsabili della produzione di false risposte sono sostanzialmente
due.
Il primo è dovuto agli effetti di matrice. Così, da una parte, un materiale non
contenente lʼanalita può avere una matrice in cui uno o più componenti interagiscono con il sistema di rivelazione per produrre una risposta falsamente positiva;
dallʼaltra parte, uno o più componenti della matrice, diversi dallʼanalita, possono interagire con il rivelatore per inibire la produzione di una risposta effettivamente positiva e dare origine a una risposta falsamente negativa.
Il secondo meccanismo opera nelle vicinanze dei limiti di soglia, per esempio un limite di rivelabilità o un limite di decisione (cut-off). Se L è un tale limite di decisione
stabilito per il procedimento in uso, ciò significa che un risultato maggiore di L porta
DOCUMENTI TECNICI
Data: 2013-02-06
DT-07-DL/DS rev. 00
Pag. 15 di 47
a concludere che lʼanalita è presente, mentre un risultato inferiore ad L porta alla
conclusione opposta, cioè che lʼanalita è assente.
Si immagini di aver esaminato numerosi bianchi; cioè, materiali con matrice della
stessa natura di quella dei campioni incogniti ma nei quali è assente (x1 = 0) lʼanalita
di interesse. Se la distribuzione dei risultati ottenuti ne comprende qualcuno maggiore di L, questi corrispondono a false risposte positive e formano la base per la
stima della probabilità, P(e / ¬A) .
In modo analogo, si immagini di aver esaminato numerose volte un materiale contenente lʼanalita al livello di concentrazione x2 > L. Se la distribuzione dei risultati ne
comprende qualcuno minore di L, questi corrispondono a false risposte negative e
formano la base per la stima della probabilità, P(¬e / A) .
La Figura 1 riporta le distribuzioni delle risposte del procedimento per le concentrazioni x1 = 0 , x2 > L e lʼindicazione del limite di decisione L. Le aree tratteggiate a
destra e a sinistra di L rappresentano, rispettivamente, la probabilità, P(e / ¬A) , di
risposte falsamente positive e la probabilità, P(¬e / A) , di risposte falsamente negative. Entrambe le probabilità possono essere stimate, dopo aver eliminato eventuali
risultati anomali (outlier), sulla base degli scarti tipo delle due distribuzioni.
È importante notare che le distribuzioni, e quindi le aree tratteggiate di interesse in
Figura1, valgono a rigore solo per i livelli di concentrazione x1 e x2. Inoltre, le aree
tratteggiate dipendono anche dal valore di L. Tale valore è tipicamente fissato pari a
3 volte lo scarto tipo sperimentale del bianco; ciò significa ritenere che non si verifichino più di 1 o 2 risultati falsamente positivi su 1000 risultati realmente negativi.
Anche la probabilità dei risultati falsamente negativi dipende ovviamente dal valore
di L; tuttavia, essa è pure influenzata dal livello di concentrazione dellʼanalita attraverso la distribuzione delle risposte del procedimento a quel livello. Per livelli alti, la
probabilità di risposte falsamente negative sarà molto bassa, ma tenderà ad assumere valori sempre maggiori man mano che la concentrazione dellʼanalita si avvicina al limite di decisione. Quindi, la consistenza delle risposte falsamente negative è
funzione dei livelli di concentrazione dellʼanalita nei materiali da esaminare.
La sottostante tabella 2 mostra esempi numerici che chiariscono meglio il significato
di queste affermazioni.
Livello di x in unità σ
3
4
5
6
Tabella 2
Limite di decisione(1) Limite di decisione(1)
(cut- off) pari a 3σ
(cut- off) pari a 3,5σ
P(e / ¬A) P(¬e / A)
P(e / ¬A) P(¬e / A)
FP
FN
FP
FN
0,00135 0,50000
0,00023 0,69146
0,00135 0,15866
0,00023 0,30854
0,00135 0,02275
0,00023 0,06681
0,00135 0,00135
0,00023 0,00621
Limite di decisione(1)
(cut- off) pari a 4σ
P(e / ¬A) P(¬e / A)
FP
FN
0,00003 0,84134
0,00003 0,50000
0,00003 0,15866
0,00003 0,02275
(1)
Si è assunto che il livello del bianco sia uguale a 0. FP, falsi positivi; FN, falsi negativi.
DOCUMENTI TECNICI
Data: 2013-02-06
DT-07-DL/DS rev. 00
Pag. 16 di 47
Per ciascun limite di decisione (cut-off) e per ciascun livello attuale di concentrazione dellʼanalita, la tabella mostra la frazione di risultati che cade al di sopra di tale limite (falsi positivi) e la frazione che cade al di sotto di tale limite (falsi negativi).
Questa situazione corrisponde, nel trattamento statistico del limite di rivelabilità, al
rischio α di commettere un errore del primo tipo (falso positivo) e al rischio β di
commettere un errore del secondo tipo (falso negativo). È importante trovare un bilanciamento fra i due errori che tenga conto della diversa importanza che può essere legata ai due rischi.
È interessante notare che, per un dato livello di decisione (cut-off), la frazione di risultati falsamente positivi è costante, mentre la frazione di risultati falsamente negativi diminuisce al crescere della concentrazione dellʼanalita, come era da attendersi.
Considerando le diverse espressioni del teorema di Bayes viste sopra, è possibile
quantificare questo andamento con valori numerici, sia mediante il rapporto di verosimiglianza, LR, sia con la probabilità “a posteriori”, P( A / e) , limitando, per semplicità, il calcolo al caso della probabilità “a priori” pari a P(A) = 0,5.
Si consideri, anzi tutto, il limite di decisione (cut-off) pari a 3σ. Applicando le formule
(2a), (6c) e (7) ai dati del secondo riquadro di tabella 2, si ottengono i valori di LR e
di P( A / e) riportati nella sottostante tabella 3.
Tabella 3: Limite di decisione (cut-off), L = 3σ e P(A) = 0,5
P ( A / e)
Livello di x in unità σ
LR
3
370,4
0,99731
4
623,2
0,99840
5
723,9
0,99862
6
739,7
0,99865
Come si può osservare chiaramente in questa tabella, sia i valori di LR che i valori
di P( A / e) sono crescenti al crescere di x, cioè crescono man mano che ci si allontana dal limite di decisione, ma il parametro LR aumenta in maniera molto netta
raddoppiando il suo valore passando da campioni che hanno una concentrazione x
= 3σ a campioni che hanno una concentrazione x = 6σ , mentre il valore di P( A / e) ,
per lo stesso aumento di concentrazione, passa da 0,99731 a 0,99865, variazione
positiva assolutamente irrilevante.
Questa è unʼaltra ragione che porta a preferire lʼuso dei valori di LR invece di quelli
di P( A / e) .
Naturalmente, le probabilità “a posteriori” dellʼassenza di A dato lʼesito positivo e del
test, cioè P(¬A / e) non sono nulle, ma costituiscono il complemento allʼunità delle
corrispondenti probabilità P( A / e) mentre i valori di LR sono lʼinverso di quelli riportati in tabella.
Si consideri, ora, il limite di decisione (cut-off) pari a 3,5σ. Si possono applicare le
formule (2a), (6c) e (7) anche al terzo riquadro di tabella 2 ed ottenere per LR e
P( A / e) i seguenti valori riportati nella sottostante tabella 4.
DOCUMENTI TECNICI
Data: 2013-02-06
DT-07-DL/DS rev. 00
Pag. 17 di 47
Tabella 4: Limite di decisione (cut-off), L = 3,5σ e P(A) = 0,5
P ( A / e)
Livello di x in unità σ
LR
3
1341,5
0,99926
4
3006,3
0,99967
5
4057,3
0,99975
6
4320,8
0,99977
Osservando questi valori si possono fare le stesse osservazioni già fatte per quelli
di tabella 3, con queste due aggiunte.
La prima riguarda i valori di LR che sono aumentati notevolmente rispetto a quelli di
tabella 3; tanto che, passando dal livello di x = 3σ al livello di x = 6σ, il valore è più
che triplicato. Ciò è dovuto essenzialmente alla netta diminuzione di P(e / ¬A) , cioè
dei falsi positivi, conseguente al fatto di aver considerato un limite di decisione L =
3,5σ. Infatti, è stato così molto diminuito lʼerrore di primo tipo a vantaggio di quello
di secondo tipo e di P(¬e / A) (falsi negativi) che è aumentato. I due effetti però non
si bilanciano, perché quello dovuto alla variazione dellʼerrore di primo tipo è preponderante rispetto a quello che si ha con lʼerrore di secondo tipo. La conclusione che
si trae da queste considerazioni ribadisce chiaramente quanto già affermato sopra
circa lʼimportanza da attribuire al valore del limite di decisione L nel calcolo del rapporto di verosimiglianza, LR , e della probabilità “a posteriori”, P( A) / e .
La seconda concerne il fatto che, quando la concentrazione dellʼanalita A nel campione risulta: x = 3σ, allora, essendo il limite di decisione (cut-off), L = 3,5σ, può essere interessante valutare lʼeffetto di un esito negativo del test sulla probabilità “a
posteriori” della presenza dellʼanalita A. A questo scopo, si applicano le formule (8).
Dalla tabella 2 si ricava, per x = 3σ:
P(¬e / A) = 0,69146
P(¬e / ¬A) = 1 ! P(e / ¬A) = 1 ! 0,00023 = 0,99977 .
Sostituendo nella formula (8), si ha:
P ( A / ¬e )
0,69146 P( A)
=
!
P(¬A / ¬e) 0,99977 P(¬A)
Il rapporto di verosimiglianza è dato dalla (8a), cioè:
0,69146
LR =
= 0,69162
0,99977
Nellʼipotesi che P(A) = 0,5, applicando la (8b) si ottiene:
0,69162
P( A / ¬e) =
= 0,40885
1 + 0,69162
Come si vede, la probabilità “a posteriori” della presenza dellʼanalita A non è trascurabile anche dopo un esito negativo del test pur su un materiale con una concentrazione x = 3σ dellʼanalita.
DOCUMENTI TECNICI
Data: 2013-02-06
DT-07-DL/DS rev. 00
Pag. 18 di 47
In questa situazione, è anche interessante calcolare quale sia il rapporto di verosimiglianza, LR, e la probabilità “a posteriori”, P(¬A / ¬e) , dellʼassenza dellʼanalita A
dato lʼesito negativo del test. Le formule da applicare sono le inverse della (8), della
(8a). Quindi, si ha:
P(¬A / ¬e) 0,99977 P(¬A)
=
!
P ( A / ¬e )
0,69146 P( A)
Tenendo conto di una probabilità “a priori” di assenza dellʼanalita A, P(¬A) = 0,5 , si
ha:
0,99977
LR =
= 1,44588
0,69146
Da cui:
LR
1,44588
P ( ¬A / ¬e ) =
=
= 0,59115
1 + LR 1 + 1,44588
Come si vede, lʼesito negativo del test comporta un rapporto di verosimiglianza, LR,
di poco superiore ad 1 (essendo 1 il valore della assoluta equivalenza tra assenza e
presenza dellʼanalita); di conseguenza, la probabilità “a posteriori”, P(¬A / ¬e) ,
dellʼassenza dellʼanalita dato lʼesito negativo del test subisce solo un lieve incremento rispetto allʼipotesi “a priori” di equiprobabilità di assenza/presenza.
In effetti, come era da aspettarsi, lʼesito negativo del test con lʼipotesi di assenza
dellʼanalita A comporta un valore di LR inverso e una probabilità “a posteriori” complemento a 1 rispetto ai valori di questi due parametri calcolati sopra con lʼipotesi
della presenza dellʼanalita A.
Si consideri, infine, il limite di decisione (cut-off) pari a 4σ. Si possono applicare le
formule (2a) , (6c) e (7) anche al quarto riquadro di tabella 2 ed ottenere per LR e
P( A / e) i seguenti valori riportati nella sottostante tabella 5.
Tabella 5: Limite di decisione (cut-off), L = 4σ e P(A) = 0,5
P ( A / e)
Livello di x in unità σ
LR
3
5288,7
0,99981
4
16666,7
0,99994
5
28044,7
0,99996
6
32575,0
0,99997
Sui valori riportati in questa tabella si possono ripetere qualitativamente le stesse
osservazioni già fatte per quelli di tabella 3 e tabella 4.
In particolare, anche in questo caso, è interessante valutare lʼeffetto dellʼesito negativo di un test sulla probabilità “a posteriori” di assenza dellʼanalita A quando la concentrazione di tale analita nel campione risulta: x = 3σ, essendo il limite di
decisione (cut-off), L = 4σ.
DOCUMENTI TECNICI
Data: 2013-02-06
DT-07-DL/DS rev. 00
Pag. 19 di 47
Dalla tabella 2 si ricava, per x = 3σ:
P(¬e / A) = 0,84134
P(¬e / ¬A) = 1 ! P(e / ¬A) = 1 ! 0,00003 = 0,99997 .
Sostituendo nelle inverse della (8) e della (8a), si ha:
P(¬A / ¬e) 0,99997 P(¬A)
=
!
P ( A / ¬e )
0,84134 P( A)
0,99997
LR =
= 1,18854
0,84134
Nellʼipotesi che P(¬A) = 0,5 , si ricava:
LR
1,18854
P ( ¬A / ¬e ) =
=
= 0,54308
1 + LR 1 + 1,18854
Le conclusioni a cui si perviene sono le stesse descritte nel caso precedente; anzi,
gli incrementi dei parametri LR e P(¬A / ¬e) sui valori, rispettivamente, 1 e 0,5, corrispondenti alla assoluta equivalenza tra assenza e presenza dellʼanalita A sono
addirittura inferiori a quelli del caso precedente.
Naturalmente, anche in questo caso, si può mostrare che i valori calcolati di LR e
P(¬A / ¬e) sono, rispettivamente, lʼinverso e il complemento a 1 dei valori di LR e
P( A / ¬e) che si ottengono considerando lʼipotesi dellʼesito negativo del test in presenza dellʼanalita A .
3.2.2
Valutazione a partire dalla esecuzione di una lunga serie di
misurazioni
Lʼapproccio più immediato alla stima della probabilità di false risposte consiste
nellʼesaminare, con il metodo dʼanalisi di interesse, il maggior numero possibile di
materiali compresi nel suo campo di applicazione, compatibilmente con tempi e costi, ed osservare i risultati ottenuti. Naturalmente, i livelli dellʼanalita e le sostanze
interferenti considerate dovrebbero essere rappresentative delle situazioni analitiche che il laboratorio può incontrare nellʼesercizio di quel metodo o test. È anche
necessario scegliere un adatto metodo di conferma, ovviamente convalidato, con
cui esaminare in parallelo gli stessi materiali.
Idealmente, la valutazione della probabilità di risposte false è molto semplice. Ad
esempio, si supponga di sottoporre ad indagine con il metodo in studio n materiali
diversi nei quali è nota lʼassenza dellʼanalita A ricercato oppure questa assenza è
stabilita con lʼesame in parallelo mediante il metodo di conferma. Se si ottengono p
risposte positive, allora la probabilità di false risposte positive è data semplicemente
da p/n, cioè: P(e / ¬A) = p / n . Una espressione analoga si ottiene per la probabilità
di false risposte negative, cioè per P(¬e / A) , quando siano stati esaminati materiali
con quantità note e maggiori di 0 dellʼanalita A o con risposte positive ottenute con il
metodo di conferma.
DOCUMENTI TECNICI
Data: 2013-02-06
DT-07-DL/DS rev. 00
Pag. 20 di 47
In realtà, questa valutazione si rivela molto difficile poiché il numero di risposte false
è generalmente molto piccolo e sorge il problema di stabilire quanti campioni esaminare per essere ragionevolmente sicuri di trovare un numero non nullo di risposte
false. In questa situazione, lʼanalista si trova di fronte a un dilemma. Da una parte,
non conoscendo quale sia, neanche approssimativamente, questo
numero (è ciò che si prefigge di determinare) non può decidere quanti campioni
esaminare; dallʼaltra parte, se decide di continuare la sperimentazione fino a riscontrare una risposta falsa, questo modo di procedere non gli permette di arrivare a disegnare un quadro reale della probabilità di risposte false. Infatti, una risposta falsa
può verificarsi al primo esame ma non ripetersi più per molti altri successivi esami.
In ogni caso, il numero di campioni da esaminare per stabilire la percentuale di false
risposte di un procedimento è sempre molto alto. Per ovviare a questa difficoltà, tenendo conto, quando possibile, della passata esperienza o della letteratura, si può
ipotizzare una percentuale di false risposte che si ritiene accettabile e procedere alla sua verifica ipotizzando che la distribuzione di tali risposte sia modellata su quella
di Poisson, così espressa:
!i
P(i ) = e #! "
(13)
i!
dove:
λ è il valore centrale della distribuzione;
e, è la base dei logaritmi naturali;
e i! è il fattoriale di i.
Si supponga, per esempio, che lo 1% di false risposte positive sia ritenuto accettabile per il procedimento in esame. Ciò significa considerare λ = 1. Da cui: P(i = 0) =
0,368; P(i = 1) = 0,368; P(i = 2) = 0,184; P(i = 3) = 0,06. Perciò, se vengono esaminati 30 campioni privi dellʼanalita di interesse e prelevati a caso, almeno 11 non dovranno presentare risposte positive, altri 11 o 12 una sola, 6-7 due e 0-2 tre.
3.3. Applicazioni del teorema di Bayes
In molti casi in cui vengono eseguite analisi qualitative si ritiene necessario applicare in parallelo un metodo di conferma. Ciò è particolarmente vero quando lʼindagine
è condotta a scopi forensi, di diagnosi medica, oppure coinvolge problemi di sicurezza o importanti investimenti. In breve, in tutti i casi in cui si avverte che una classificazione errata avrebbe serie conseguenze, si decide di esaminare i campioni
anche con il metodo di conferma.
Le probabilità di false risposte, P(e / ¬A) e P(¬e / A) , stimate come descritte in precedenza, si impiegano quando la correttezza della presunta classificazione non è
critica mentre alto è il costo della conferma. Infatti, nella routine, risultati positivi si
confermano con un metodo indipendente ogni qual volta ci si aspetta che lʼanalita
sia assente nel campione. I risultati negativi non vengono confermati per ridurre i
costi. Analogamente, se ci si aspetta che lʼanalita sia presente, un risultato negativo
viene confermato ma non uno positivo. Per il resto, il risultato del test viene accompagnato dal valore di P(e / ¬A) o di P(¬e / A) oppure dal valore del rapporto di veroDOCUMENTI TECNICI
Data: 2013-02-06
DT-07-DL/DS rev. 00
Pag. 21 di 47
simiglianza, LR , se non è noto il valore della probabilità “a priori” sulla presenza,
P(A), o sulla assenza, P(¬A) , dellʼanalita A di interesse e si è ipotizzato P(A) =
P(¬A) oppure si riporta il valore della probabilità “a posteriori” se è nota una probabilità “a priori” tale che: P(A) ≠ P (¬A) .
Bisogna, inoltre, tener presente la possibilità di decidere lʼappropriata classificazione di un oggetto in seguito agli esiti di una serie di test (si veda il paragrafo 4) di facile esecuzione anche se poco precisi invece dellʼimpiego di un singolo metodo preciso ma molto più impegnativo in termini di tempo o di costi. Così, per ricavare
una particolare valutazione qualitativa, un analista può eseguire diversi test fino a
che lʼoggetto di interesse sia classificato con un adeguato livello di probabilità oppure lʼindagine si debba concludere per aver raggiunto il limite di tempo o di costo stabilito. In Figura 2 viene rappresentato un percorso analitico iterativo che indica come procedere nella valutazione cumulativa degli esiti di successivi test, in termini,
n
ad esempio di " = ! ( LR ) i , cioè del prodotto dei rapporti di verosimiglianza corrii =1
spondenti. Per decidere quando interrompere la sperimentazione, si può impiegare
il criterio:
(14)
! > !T
dove: ФT è il valore critico prefissato che deve essere superato dal prodotto
n
! ( LR)
i
.
i =1
In pratica, il procedimento consiste semplicemente nel confrontare ! con ! T man
mano che si acquisiscono i risultati dei test interrompendo il percorso analitico una
volta che la (14) sia soddisfatta.
3.4. Conclusioni per il teorema di Bayes
Il teorema di Bayes mette a disposizione un semplice strumento numerico per valutare lʼattendibilità di una analisi qualitativa combinando nel valore di un unico parametro le probabilità di falso positivo e di falso negativo. Tale parametro può essere
espresso in due modi diversi, con il rapporto di verosimiglianza o con la probabilità
“a posteriori”, a seconda che non si disponga o si disponga di una informazione sulla probabilità “a priori”. Siccome, in genere, si verifica la prima situazione, il rapporto
di verosimiglianza è il più frequentemente usato.
Va, comunque, ricordato che la classificazione effettuata è tanto più obiettiva quanto più lo sono i valori dei parametri di convalida del test o del metodo impiegato e
che uno dei maggiori vantaggi di questo modo di valutare le analisi qualitative consiste nel rendere possibile e facile un esame critico dei procedimenti e delle ipotesi
considerate.
DOCUMENTI TECNICI
Data: 2013-02-06
DT-07-DL/DS rev. 00
Pag. 22 di 47
DOCUMENTI TECNICI
Data: 2013-02-06
DT-07-DL/DS rev. 00
Pag. 23 di 47
DOCUMENTI TECNICI
Data: 2013-02-06
DT-07-DL/DS rev. 00
Pag. 24 di 47
4. Metodo degli intervalli statistici
Questa procedura [Pulido et al., 2002] è basata come nelle analisi quantitative sulla
distribuzione gaussiana che viene ampiamente utilizzata nel determinare i limiti di
rivelabilità di un metodo.
Questa procedura richiede di stabilire una relazione tra il limite di specifica, spesso
espresso come concentrazione e la risposta strumentale. Per confronto della risposta di un campione qualsiasi con uno al limite di specifica, si prende una decisione
si/no specificando la probabilità di commettere un errore.
Rispetto a Bayes e le tabelle di contingenza vi sono due principali differenze:
-
Si utilizzano le risposte strumentali per cui si lavora con dati continui e
non binari;
-
Per stabilire lʼincertezza, i campioni da analizzare vengono preparati al
livello di concentrazione del limite di specifica, al contrario degli altri
metodi in cui campioni da analizzare erano prepararti a differenti livelli di
concentrazione.
Con il metodo degli intervalli statistici, la sperimentazione comprende un set di
campioni tutti contenenti lʼanalita al limite di specifica che vengono analizzati nSL
volte in condizioni di precisione intermedia in modo da includere la maggior sorgente di imprecisione. In questo modo si può calcolare la media della risposta strumentale (rsl) e la sua deviazione standard (s).
Per comparare se una risposta strumentale (ri) di un campione è minore o uguale o
più alta del limite di specifica, rSL, si stabilisce un limite di cut-off (rcutoff) ( vedi Fig.1).
Se si assume che la risposta strumentale segue una distribuzione normale, il rcut-off
si calcola dal limite di predizione più basso della media delle risposte strumentali
(rSL):
rcutoff = rSL ± t(v,alfa) x sSL
(1)
dove sSL è calcolato da :
sSL = (1/m + 1/nSLl)1/2 x s
DOCUMENTI TECNICI
Data: 2013-02-06
(2)
DT-07-DL/DS rev. 00
Pag. 25 di 47
dove t è il valore tabulato della statistica t al livello di significatività voluto con ν
gradi di libertà. nSL sono il numero di determinazioni indipendenti fatte per calcolare
rSL ed m è il numero di repliche fatte sul campione in esame . Normalmente m = 1.
Il segno + o – nellʼequazione 1 dipende da come si stabilisce il limite della specifica.
Passiamo ora allʼesame dellʼesempio del limite di aflatossina di 2 mg/l. È evidente
che in questo esempio solo il segnale superiore è quello che interessa.
Con la tecnica usuale vengono analizzati 34 campioni tutti contenenti aflatossina B1
al livello di 2 µ/g. Si sono ottenuti i seguenti risultati:
Media delle 34 risposte strumentali rSL = 0,483
con s = 0,038
sSL = (1 + 1/34)1/2 x s = 0,039
Da cui per α = 5% dallʼequazioni sopra:
rcut-off = 0,551
Ne consegue che tutti i campioni con un r ≤ a 0,551 sono statisticamente uguali o
più bassi del limite legale. La probabilità di commettere un errore è del 5%. (Fig.
1a). Allo stesso modo tutti i campioni che sono al di sotto dellʼ rcut-off sono statisticamente più alti di rSL e quindi non conformi al limite di legge (Fig.1b)
Quindi 0.551 è il limite strumentale invalicabile per dichiarare conforme un prodotto.
Risulta evidente come la conformità dipenda dalla scelta a priori della probabilità alfa di commettere un errore del I tipo (o falso positivo).
In pratica, una volta fissato α lʼanalista è in grado di prendere una decisione a posteriori circa la conformità di un dato campione. Questo significa che la decisione
viene presa dopo che si è registrato il segnale del campione. In questo modo
lʼincertezza di misura è spostata dal risultato analitico al limite di cut-off e la decisione avviene sulla base del confronto di ri con rcutoff. Questa strategia è molto utile per
i metodi di screening che devono essere utilizzati in modo routinario.
DOCUMENTI TECNICI
Data: 2013-02-06
DT-07-DL/DS rev. 00
Pag. 26 di 47
Figura 1 – Metodo degli intervalli statistici ( Pulido et al., 2002) Si può anche calcolare un limite di screening (Fig. 2), rscreening, considerando la probabilità di commettere un errore del II tipo (o falso negativo). Considerando sempre
lʼesempio delle aflatossine in cui la concentrazione di un analita in un campione non
può essere sopra il limite di specifica csl , β rappresenta la probabilità di giudicare il
campione conforme quando non lo è (cioè quando è superiore al csl). In questo caso per calcolare rscreening si usa la seguente equazione:
rscreening = rSL + t(α,β, v) x sSL
(3)
in cui lʼanalista deve fissare due dei seguenti tre parametri: alfa, beta e rscreening - rSL
. Questʼultimo non è altro che la minima differenza attesa tra ri e rSL che lʼanalista
desidera rilevare alle probabilità alfa e beta stabilite.
Delta (alfa,beta,v) dipende quindi dalle probabilità di errore alfa e beta.
Ancora sSL è calcolato dalla relazione 2. Dallʼequazione 3 può essere dedotto che il
limite di screening dipende dalle probabilità di commettere errori del I e II tipo.
DOCUMENTI TECNICI
Data: 2013-02-06
DT-07-DL/DS rev. 00
Pag. 27 di 47
rscreening può essere calcolato ( per esempio quando una concentrazione deve essere minore del limite specificato ) facendo lo stesso ragionamento e cambiando i segni nellʼequazione 3.
Il limite di screening è un valore a priori che una volta trasformato in concentrazione
può essere utilizzato per paragonare metodi differenti o per selezionare un dato metodo per un problema specifico.
Questa metodologia può essere applicata solo quando si utilizza uno screening
strumentale che fornisce risposte numeriche o continue. Non può essere applicato
quando si hanno risultati dicotomici (i.e. si/no) come nel caso di analisi con kit.
Questa metodologia, al contrario delle altre viste prima che assegnano probabilità
basate su campioni analizzati prima, al contrario tiene in considerazione il campione
individuale in esame.
Figura 2 – Metodo del limite di screening
5. Le curve di potenza
Un altro modo per stabilire lʼincertezza nelle analisi qualitative è quello delle curve di
potenza. Queste curve vengono stabilite utilizzando una tecnica di screening basata
sullʼanalisi di molti campioni a differenti livelli di concentrazioni.
Il metodo di operare è semplice: campioni “bianchi” vengono addizionati di differenti
livelli di concentrazione di analita in modo che la loro concentrazione sia al di sopra
o al di sotto del limite della specifica.
Si fanno molte repliche a ciascuna concentrazione in condizioni di precisione intermedia. A ciascun livello di concentrazione si valuta il numero di risultati positivi e
poi si mettono in grafico il numero della % di positivi vs la concentrazione. Questo
grafico permette di determinare il cut-off della concentrazione cioè la concentrazione dalla quale la risposta ottenuta è superiore al limite di specifica per una data
probabilità di commettere un errore. Si può anche stabilire un intervallo o regione di
incertezza in cui le probabilità alfa e beta possono essere calcolate.
DOCUMENTI TECNICI
Data: 2013-02-06
DT-07-DL/DS rev. 00
Pag. 28 di 47
La Fig. 3 mostra una curva di performance ottenuta per la determinazione
dellʼaflatossina B1 mediante il test ELISA.
Figura 3 – Metodo delle curve di potenza
Per ottenere la curva di performance, sono state preparate campioni addizionati
dellʼanalita a cinque livelli di concentrazione di cui due sopra o sotto il limite del limite di specifica ed una al limite di specifica. A ciascun livello sono state effettuate 10
determinazioni (vedere tabella 1). Una volta effettuate le analisi sono state calcolate
le percentuali dei risultati positivi o negativi ottenuti (tabella 1). Queste risposte sono
state utilizzate per costruire il grafico di Figura 3 dal quale è possibile determinare la
concentrazione cut-off in base al livello di probabilità di commettere un errore alfa e
beta (cioè falso positivo e falso negativo).
Risultati positivi e negativi ottenuti nellʼanalisi del bianco e del bianco addizionato a
differenti livelli di concentrazione
Concentrazione
Risultati positivi (negativi)
Risposte positive
3
10 (0)
100
2,5
10 (0)
100
2
5 (5)
50
1,5
1 (9)
10
1
0 (10)
0
Questa concentrazione può essere rappresentata sul grafico da una linea verticale
che può essere spostato a destra o sinistra a seconda delle probabilità prescelte.
Se si considera un campione ad un livello specificato (per esempio 2 mg) si avrebbe
un risultato accettabile solo il 50% delle volte. Considerato che si vuole avere un
bassa percentuale di falsi negativi essendo la sostanza pericolosa, possiamo porre
il livello di cut off tra 1,5 e 1,0 µg /g.
DOCUMENTI TECNICI
Data: 2013-02-06
DT-07-DL/DS rev. 00
Pag. 29 di 47
Se lo poniamo a 1.5, il 10% (1 su 10) delle nostre decisioni sarebbero false positive,
cioè che le avremmo considerate sopra il limite di specifica mentre di fatto sarebbero al disotto del limite.
Per stabilire la regione di incertezza, devono essere fissate le % di falsi positivi e
falsi negativi. Nellʼesempio precedente se fissiamo le probabilità al 5% la regione id
incertezza sarà tra 1,25 e 2,4 µg /g. È chiaro che più precisa è la curva di performance più piccola sarà la regione dellʼincertezza che naturalmente dipende dal numero di misurazioni ripetute effettuate a ciascun livello e dal numero dei livelli considerati.
Lo svantaggio di questo metodo rispetto, per esempio, a quello di Bayes è che
quando il numero delle misurazioni ripetute in una certa regione è basso, è anche
bassa la probabilità di trovare risultati positivi o negativi in una popolazione finita di
campioni. È evidente che aumentando il numero delle misurazioni ripetute il metodo
diventa costoso ed il tempo di analisi molto lungo.
Questo approccio è invece utile quando non si conosce la precisione del metodo
che per esempio è stato sviluppato di recente nel laboratorio (metodo interno). È utile anche quando si lavora con KIT che forniscono risultati positivi o negativi.
Quando si ottengono risultati dubbi la curva di performance varia.
Infine, è utile ricordare che questo è un metodo generale che può essere applicato
a tutti i sistemi di screening.
6. Conclusioni
Selezionare una specifica procedura dipende dal problema analitico che si deve affrontare e dalla tecnica di screening che si utilizza.
Per esempio se la tecnica di screening fornisce solo risultati positivi o negativi (risposta dicotoma) la sola procedura che non può essere applicata è quella degli intervalli statistici. Le tabelle di contingenza sono invece di applicazione generale. Al
contrario, quando si ha che fare con tecniche che forniscono una risposta continua
la procedura da raccomandare è quella degli intervalli statistici.
Il calcolo per stimare lʼincertezza dei diversi metodi sono differenti sia per il numero
che per i livelli di concentrazione.
Quando si usano le tabelle di contingenza vengono analizzati campioni a differenti
livelli di concentrazione sebbene i campioni sono considerati in solo due livelli di
concentrazione (alto e basso rispetto al limite della specifica). Allo stesso modo
quando vengono utilizzate le curve caratteristiche sono necessarie analisi a diversi
livelli di concentrazione e numerose analisi a ciascun livello.
Infine, quando vengono utilizzati gli intervalli statistici devono essere analizzati molti
campioni ma ad un solo livello di concentrazione.
È utile, infine, segnalare alcune particolarità del settore medico che sono illustrate
nella appendice A.
DOCUMENTI TECNICI
Data: 2013-02-06
DT-07-DL/DS rev. 00
Pag. 30 di 47
Appendice A. Indicazioni pratiche MEQUALAN
CLSI EP12 e
Come abbiamo visto le analisi qualitative consistono in un processo di classificazione. Oggetti o materiali vengono assegnati ad una determinata classe sulla base delle risposte ottenute attraverso i test a cui vengono sottoposti.
Sovente i laboratori medici forniscono agli utenti risultati qualitativi nominali (presente/assente, positivo/negativo, reattivo/non reattivo, etc..) oppure qualitativi ordinali
(negativo-grayzone, debolmente positivo, positivo, fortemente positivo, ecc.) come
interpretazione di misurazioni quantitative in base a livelli soglia (cut-off) stabiliti da
norme, linee guida, convenzioni o dal produttore dei consumabili impiegati.
In altri casi il risultato qualitativo ordinale (negativo/debolmente positivo/positivo
+/positivo ++/positivo +++) è ottenuto come tale dal processo di misura (per esempio, reazioni di agglutinazione).
Analogamente, in molti metodi il risultato qualitativo nominale è fornito direttamente
dal metodo analitico (ricerche colturali, metodi immuno-cromatografici, reazioni a
lettura visuale, etc.).
Nel primo caso (interpretazione qualitativa di una misura quantitativa) l'incertezza di
misura appartiene al procedimento di misura strumentale e si applicano conseguentemente le raccomandazioni descritte nei documenti pertinenti [BIPM, et al., 2007;
EA4/16, 2003; Sinal DT-0002, 2000; Eurachem/Citac, 2000].
La guida Sinal DT-0002/6, Guida al calcolo della ripetibilità, infatti, ricorda che “[...]
In questi ultimi casi al laboratorio si richiede di effettuare una stima di ripetibilità sulle grandezze di ingresso/stimolo.”.
Possiamo senz'altro considerare esempi di grandezze di ingresso/stimolo i risultati
espressi in unità arbitrarie, in unità internazionali, in densità ottica espressa come
rapporto con un valore soglia o cut-off.
Negli altri casi, invece, quando non è disponibile alcun risultato quantitativo, l'analisi della variabilità può basarsi solo sulla probabilità dei risultati errati (falsi positivi,
falsi negativi).
A.1. Variabilità dei risultati qualitativi. CLSI EP12 e MEQUALAN
A.1.1 CLSI-EP12 - Evaluation of Qualitative Test Performance
Nella revisione 2005/2006 della linea guida EP12 del Clinical and Laboratory standards Institute [Clinical and.., 2007], il gruppo di lavoro ha aggiunto al protocollo di
valutazione le informazioni sui limiti di confidenza ottenuti da un certo numero di risultati raccolti, consentendo all'utente di visualizzare direttamente la differenza di
limiti di fiducia quando si riduce o si aumenta il numero di osservazioni effettuate.
Inoltre, sono stati inseriti e definiti alcuni nuovi termini. Il termine "intervallo C5-C95"
è usato per descrivere l'intervallo intorno al valore soglia (C50), dove i risultati positivi vanno dal 5 al 95% .
DOCUMENTI TECNICI
Data: 2013-02-06
DT-07-DL/DS rev. 00
Pag. 31 di 47
Il cut-off di un metodo qualitativo è la soglia sopra la quale il risultato è riferito come
positivo e sotto la quale è invece dato come negativo.
La soglia di concentrazione, qui indicata come C50, è la concentrazione a cui il 50%
di una grande serie di risultati è positivo. Se si esegue una grande serie di prove su
un campione con concentrazione effettiva superiore a C50, ci si aspetterebbe risultati positivi in più del 50% dei casi.
Allo stesso modo, a concentrazioni al di sotto del cut-off, ci si aspetterebbe risultati
negativi, in più del 50% dei casi. Maggiore è la concentrazione al di sopra della soglia (o più bassa è la concentrazione al di sotto della soglia) nel campione sottoposto a prova, maggiore è la probabilità che i risultati ripetuti siano positivi (o negativi).
La Figura 4 qui di seguito riportata è una rappresentazione grafica di come la percentuale di risultati positivi e negativi di una grande serie dovrebbero variare in funzione della effettiva concentrazione intorno al cut-off. Nella Figura 4, si nota che
l'aumento della concentrazione di analita di piccole quantità (spostamento a destra
del cut-off) e l'esecuzione di un gran numero di prove su ciascun campione, dovrebbe produrre corrispondentemente più risultati positivi (si spostano verso l'alto
sulla asse verticale a sinistra), e meno risultati negativi (in alto sull'asse verticale a
destra). Allo stesso modo, diminuendo le concentrazioni dello stesso valore (spostamento a sinistra del cut-off), si dovrebbero produrre corrispondentemente meno
risultati positivi (spostarsi in basso sulll'asse verticale a sinistra) e maggiori percentuali di risultati negativi (spostarsi in basso sull'asse verticale a destra). La forma attuale e la pendenza della curva sarà diversa per i vari metodi studiati.
Questa descrizione del cut-off o punto discriminante in una prova qualitativa consente di comprendere il fatto che, a causa dell'imprecisione, i campioni con concentrazioni di analita vicino alla soglia non darà risultati completamente coerenti (nel
senso positivo o negativo, più o meno, assente o presente) con più osservazioni
dello stesso campione.
Figura 4 - Curva di potenza, risultati positivi in funzione della concentrazione.
(ridisegnato da CLSI-EP12)
DOCUMENTI TECNICI
Data: 2013-02-06
DT-07-DL/DS rev. 00
Pag. 32 di 47
Ci sono diversi modi per descrivere la variabilità dei risultati ripetuti per i campioni
con concentrazione vicino a C50. La concentrazione superiore a C50 in cui i risulta
ti sono positivi al 95% e la concentrazione al di sotto di C50 in cui i risultati sono al
95% negativi sono state chiamate "95% intervallo" per il metodo. Tuttavia, questa
terminologia è stata a volte confusa con il 95% intervallo di fiducia per il livello soglia.
Invece, la nuova terminologia " intervallo C5-C95 " come indicato (C5-C95) è introdotta appunto al fine di rappresentare "l'intervallo da C5 a C95." La lettera "C" rappresenta la concentrazione, e il pedice indica la percentuale di risultati positivi.
Quando si guarda ai risultati positivi, C5 è la concentrazione al di sotto C50 in cui i
risultati sono più del 5% positivi o negativi del 95% (l'estremo inferiore del 95% intervallo), e C95 è la concentrazione sopra C50 in cui i risultati sono più del 95% positivi o negativi del 5% (l'estremo superiore del 95% intervallo). Una discrepanza tra
un cut-off dichiarato ed una vera soglia C50 rappresenta un errore sistematico
(bias).
A concentrazioni al di fuori dellʼintervallo C5-C95 (<C5 o >C95), la capacità di un
metodo di produrre costantemente lo stesso risultato su osservazioni ripetute nello
stesso campione è una caratteristica di robustezza. L'ampiezza di C5-C95 fornisce
informazioni circa la precisione dei test qualitativi perché essa riflette la percentuale
effettiva di concentrazioni a cui i risultati ripetuti sono incoerenti.
La Figura 2 è una rappresentazione grafica di come la percentuale di controlli positivi e negativi in una grande serie di risultati varia in funzione della concentrazione
effettiva del campione vicino a C50 in due situazioni (per entrambe le situazioni, la
concentrazione C50 è lo stesso, quindi non vi non è sistematica differenza tra i due
casi). Nel caso 1, la curva è molto ripida vicino C50, e solo un piccolo incremento di
concentrazione in entrambe le direzioni avrebbe reso quasi tutti positivi o tutti risultati negativi. Nel Caso 2, la curva è meno ripida vicino C50, e gli stessi piccoli incrementi darebbero una combinazione di risultati positivi e negativi.
CLSI EP12/A2 descrive quindi un esperimento per la precisione di questi metodi.
L'approccio deriva da quello originariamente proposto da ECCLS, che non fornisce
in realtà l'intervallo C5-C95, ma stabilisce se un intervallo di concentrazioni pari a ±
20% intorno a C50 è maggiore o minore di C5-C95. Da notare che l'intervallo ± 20%
è scelto a scopo squisitamente didattico e dimostrativo, un po' come l'intervallo ± 2
volte lo scarto tipo in altri campi. Nel singolo caso l'intervallo da valutare dovrà essere stabilito in base all'utilizzo dei risultati.
A.1.2 Progetto MEQUALAN
Il progetto MEQUALAN è stato promosso dalla Unione Europea per arrivare ad avere risposte semplici, tipo sì o no, dalle analisi chimiche qualitative. Il documento finale, pubblicato nel 2003, contiene valide indicazioni per la stima dell'incertezza di
misura [Rìosl et al., 2003].
Come in CLSI EP12-A2, l'incertezza di misura è un intervallo di concentrazioni (C0C1) intorno al livello soglia CDL.
DOCUMENTI TECNICI
Data: 2013-02-06
DT-07-DL/DS rev. 00
Pag. 33 di 47
L'esperimento per determinare l'intervallo C0-C1 di incertezza consiste secondo
MEQUALAN nell'analisi di 10 replicati di 5 preparati, distribuiti in altrettanti livelli di
concentrazione, di cui uno al livello soglia (CDL), due sotto e due sopra. La stima di
C0 e C1 si ottiene per estrapolazione dalla regressione lineare tra concentrazione e
frequenza di positivi.
Figura 5 - Curve di potenza di metodi diversi (ridisegnato da CLSI-EP12).
Figura 6. Approccio MEQUALAN all'incertezza dei metodi qualitativi
DOCUMENTI TECNICI
Data: 2013-02-06
DT-07-DL/DS rev. 00
Pag. 34 di 47
Figura 7. Esperimento MEQUALAN per l'incertezza
A.2 Casi d'uso
Caso A. Metodo per la rilevazione di popolazioni miste di eritrociti
[MEQUALAN, web ]
Nel campo dell'anti-doping, si possono usare due approcci per dimostrare la presenza di una sostanza proibita in un campione o l'uso di una sostanza proibita in un
atleta. Il primo approccio è diretto: un metodo analitico dimostra la presenza della
sostanza. Il secondo approccio, indiretto, punta a dimostrare variazioni nel metabolismo causate dal doping. Un esempio di metodo diretto per dimostrare la presenza
nel sangue dell'atleta di popolazioni differenti di eritrociti derivanti da trasfusione
omologa (o allogenetica) si basa sulle piccole differenze tra antigeni eritrocitari minori tra donatore e ricevente, che possono essere rivelate dai fenotipi analizzati con
tecniche in citometria di flusso e reagenti immunoematologici ordinari.
Le analisi in citometria di flusso possono essere realizzate con un citometro dotato
di un software opportuno. Il software utilizza i segnali nel canale frontale (forward
channel) confrontati con quelli nei canali laterali (sideward channels) con una scala
lineare (piuttosto che logaritmica) e parametri stabiliti. Si conteggiano 50.000 eventi
per ciascun anticorpo e si utilizzano le letture di un controllo interno (col solo anticorpo secondario) per aggiustare il voltaggio del canale FL1 intorno al valore 1 di
fluorescenza. Quindi si leggono i campioni.
DOCUMENTI TECNICI
Data: 2013-02-06
DT-07-DL/DS rev. 00
Pag. 35 di 47
Per interpretare i risultati servono altri due controlli: con uno si identifica la posizione
di un secondo picco di eventi, mentre il terzo conferma la posizione del picco intorno al valore 1.
Ciascun istogramma viene classificato come incerto, popolazione singola o popolazione doppia. Un picco secondario valido deve avere più di 100 eventi con un rapporto segnale/fondo maggiore di 3. Il segnale è definito come “numero di eventi nella regione che definisce il picco minore”.
In caso di dubbio, l'istogramma è interpretato come popolazione singola.
L'interpretazione finale può essere: campione negativo, sospetto o positivo. Il sospetto ha solo un istogramma con doppia popolazione. Il positivo ha almeno due istogrammi con doppia popolazione.
Ai fini della validazione del metodo, quindi della determinazione dell'incertezza di
misura e del limite di ripetibilità, il risultato da considerare non può essere né l'interpretazione del campione (positivo/negativo/sospetto) né quella dell'istogramma
(doppia/incerto/singola) bensì il valore quantitativo del “numero di eventi nel picco
minore”, come indicato dall'autore del metodo originale [Giraud et al., 2008].
Caso B. Analisi chirale delle amfetamine
Circa 34 milioni di persone nel mondo abusa di stimolanti come le amfetamine, soprattutto metamfetamina. Queste sostanze hanno uno o più atomi di carbonio asimmetrico, quindi possono presentarsi come differenti enantiomeri, che hanno valore legale. Infatti, la metamfetamina si trova di più come d-isomero, ma anche come miscela di isomero d ed isomero l, che hanno effetti farmacologici diversi. lmetamfetamina è 5-10 volte più potente della l-metamfetamina sul sistema nervoso
centrale.
La separazione chirale delle amfetamine si può fare con elettroforesi capillare. Si
aggiunge un separatore chirale (di solito ciclodestrina) o uni dei suoi derivati. Il metodo più usato per la rilevazione è l'assorbimento in UV.
Recentemente, come alternativa più specifica e sensibile è stata proposta la spettrometria di massa.
Sono stati determinati ripetibilità e limiti di rivelazione per un metodo di questo tipo.
Il coefficiente di variazione nella serie dei tempi di ritenzione e delle aree del picco
degli enantiomeri di 6 composti sono risultati inferiori a 0,58% e 7,83%. Tra le serie
arrivano al massimo a 1,58% e 9,97% rispettivamente. Il limite di rivelazione è stato
definito come segnale 3-4 volte il livello del fondo ed è stato determinato come 0,01
μg/mL per metamfetamina.
Le curve di taratura sono state dimostrate lineari tra 0,05 e 10 μg/mL.
I laboratori antidoping cercano la metamfetamina e usano come campo di misura i
valori superiori a 25 ng/mL. Dall'esame si ricavano valori quantitativi, espressi come
concentrazione o come quoziente con il campione (di misura) interno, interpretati ai
fini legali come presente/assente.
Ai fini della validazione del metodo, quindi della determinazione dell'incertezza di
misura e del limite di ripetibilità, il risultato da considerare non può essere l'interpretazione del campione (presente/assente) bensì il valore quantitativo della concentrazione in ng/mL o come rapporto con il campione (di misura) interno.
DOCUMENTI TECNICI
Data: 2013-02-06
DT-07-DL/DS rev. 00
Pag. 36 di 47
Caso C. Identificazione di eritropoietina e darpoetina alfa [Iio et al., 2005]
La World Anti-Doping Agency (WADA) inserisce l'eritropoietina (EPO) e gli analoghi
sintetici tra le sostanze proibite di tipo “non soglia”, ossia sostanze che trovate in
qualsiasi quantità costituiscono violazione della regola antidoping. La ricerca di eritropoietina e analoghi si avvale della tecnica di Isoelectric Focusing (IEF), in un intervallo di pH compatibile col punto isoelettrico delle diverse sostanze
(solitamente tra 2 e 6) e in condizioni denaturanti con urea 7M.
Dopo la separazione, si esegue un doppio trasferimento (blotting). Nel primo blot, le
proteine nel gel sono trasferite in una prima membrana PVDF. Quindi l'anticorpo
monoclonale (mAb) cloneAE7A5 viene applicato per riconoscere EPO. Il secondo
blot distrugge l'interazione tra EPO e mAb a pH acido, così mAb viene trasferito alla
seconda membrana PVDF. La posizione del mAb sulla membrana è rivelata aggiungendo una sequenza di reagenti (anticorpo secondario anti-topobiotinilato,
complesso perossidasi-streptavidina, substrato chemiluminescente) terminata dalla
perossidasi. L'immagine viene interpretata con i seguenti criteri:
rEPO
1. nell'area basica ci sono 3 bande consecutive accettabili;
2. le due bande più intense alla densitometria sono tra queste e sono consecutive;
3. ciascuna delle due bande più intense deve essere in densitometria almeno due
volte più intensa di qualsiasi banda nell'area “endogena”;
NESP
1. nell'area acida ci sono 3 bande consecutive accettabili (B, C e D);
2. le banda più intense alla densitometria è la seconda o la terza (C e D);
3. la banda più intensa nell'area acida deve essere in densitometria almeno due volte più intensa di qualsiasi banda nell'area “endogena”.
Ai fini della validazione del metodo, quindi della determinazione dell'incertezza di
misura e del limite di ripetibilità, il risultato da considerare può essere l'interpretazione del campione (presente/assente) con i criteri stabiliti, anche se il
valore quantitativo della densitometria è in pratica disponibile.
Caso D. determinazione immunoenzimatica della teofillina
Nei cavalli da corsa sono attualmente utilizzate diverse molecole, farmaci antiinfiammatori non steroidei (FANS) e teofillina, di cui sono ben conosciuti gli effetti
farmacologici sulla circolazione e la respirazione. La teofillina è inclusa nelle sostanze proibite dalla USEF [Sanford et al., 1974; United....2007].
La determinazione della teofillina è ottenuta per lo più con metodi immunometrici,
meno spesso con metodi cromatografici. Un tipico cut-off nelle urine è 30 ng/mL
[Garcinuno et al., 2000; Caslavska et al., 1999].
Ai fini della validazione del metodo, quindi della determinazione dell'incertezza di
misura e del limite di ripetibilità, il risultato da considerare non può essere l'interpretazione del campione (presente/assente) bensì il valore quantitativo della concentrazione in ng/mL o come rapporto con il campione (di misura) interno.
DOCUMENTI TECNICI
Data: 2013-02-06
DT-07-DL/DS rev. 00
Pag. 37 di 47
A.3. Conclusioni
I metodi con risultati qualitativi aumenteranno la loro diffusione sia nei laboratori di
prova che nei laboratori medici, nonché in molte situazioni esterne ai laboratori (cliniche e non) in cui sia necessario ottenere rapidamente risultati utili per le
decisioni da prendere.
L'espressione qualitativa dei risultati rende meno immediata l'applicazione dei concetti fondamentali di metrologia concernenti le determinazioni di variabilità, incertezza di misura, ripetibilità, riproducibilità, nonché le verifiche con prove ripetute, in
doppio o superiori.
La difficoltà ha indotto taluno, anche recentemente [A2LA et al., 2007], a considerare la stima dell'incertezza di questi metodi un esercizio privo di significato.
Tuttavia, si riconosce da più parti che la definizione della problematica dei metodi
con risultati interpretativi o qualitativi è assolutamente necessaria [ENFSI.., 2006].
Si è costituito infatti nel tempo un corpus di conoscenze abbastanza robusto per
consentire un approccio rigoroso alla variabilità dei metodi qualitativi.
Innanzitutto, è necessario utilizzare quando disponibili le misure quantitative, come
variabili d'ingresso, ogni qual volta il risultato qualitativo, positivo-negativo, sia il risultato di una interpretazione basata su livelli soglia e intervalli decisionali.
Quando invece il risultato qualitativo è l'unica informazione disponibile, occorre stimare l'intervallo di variabilità tra due punti significativi per l'importanza degli errori,
ad esempio le concentrazioni al 5% ed al 95% dei risultati positivi.
Attualmente sia i produttori di metodi di laboratorio che gli utilizzatori non sono familiari con questo approccio e possono mancare loro alcuni strumenti necessari, come
ad esempio la stima indipendente dei livelli di concentrazione nei campioni di prova
o l'intervallo di incertezza accettabile per l'uso previsto dell'esame diagnostico.
Per questo è ragionevole prevedere un periodo di sperimentazione, progressivamente sempre più estesa ed approfondita, che consenta di accumulare le conoscenze e le esperienze necessarie.
DOCUMENTI TECNICI
Data: 2013-02-06
DT-07-DL/DS rev. 00
Pag. 38 di 47
Appendice B. Definizioni da CLSI EP12-A2 (2007) e
documento Accredia RT08_rev02 (11-09-2012)
Ai fini del presente documento si applicano i termini e le definizioni seguenti.
Prova: Determinazione di una o più caratteristiche di un oggetto di valutazione della conformità, secondo una procedura [RT08 rev02, 3.1.3].
Tecnica di prova: Tecnica che individua il principio su cui si fonda il metodo di
prova [RT08 rev02, 3.1.5].
Metodo di prova: Procedura tecnica specificata per eseguire una prova [RT08
rev02, 3.1.6].
Riferibilità metrologica: proprietà di un risultato di misura per cui esso è posto in relazione a un riferimento attraverso una documentata catena ininterrotta di tarature,
ciascuna delle quali contribuisce allʼincertezza di misura [VIM 3rd Edition, UNI CEI
70099: 2008, 2.41].
Accuratezza: Grado di concordanza tra un risultato di una prova e il valore di riferimento accettato [UNI ISO 5725-1:2004, 3.6], oppure: Grado di concordanza tra un
valore misurato e un valore vero di un misurando [VIM 3rd Edition, UNI CEI 70099:
2008, 2.13].
Scostamento sistematico (bias): Differenza tra la speranza matematica dei risultati di prova ed un valore di riferimento accettato [UNI ISO 5725-1:2004, 3.8], oppure: Stima di un errore di misura sistematico [VIM 3rd Edition, UNI CEI 70099: 2008,
2.18].
Precisione: Grado di concordanza fra risultati di prova indipendenti ottenuti nelle
condizioni stabilite [UNI ISO 5725-1-1:2004, 3.12], oppure: Grado di concordanza
tra indicazioni o valori misurati ottenuti da un certo numero di misurazioni ripetute dello
stesso oggetto o di oggetti similari, eseguite in condizioni specificate [VIM 3rd Edition, UNI CEI 70099: 2008, 2.15].
Ripetibilità: Precisione in condizioni di ripetibilità [UNI ISO 5725-1:2004, 3.13] e
[VIM 3rd Edition, UNI CEI 70099: 2008, 2.21].
Condizioni di ripetibilità: Condizioni nelle quali risultati di prova indipendenti sono
ottenuti con lo stesso metodo su un identico materiale, nello stesso laboratorio, dallo stesso operatore, usando la stessa apparecchiatura e in intervalli di tempo brevi
[UNI ISO 5725-1:2004, 3.14], oppure: Condizione di una misurazione che assicura:
la medesima procedura di misura, lo stesso luogo e l’esecuzione di misurazioni ripetute dello stesso oggetto, o di oggetti simili, in un intervallo di tempo esteso; la conDOCUMENTI TECNICI
Data: 2013-02-06
DT-07-DL/DS rev. 00
Pag. 39 di 47
dizione può invece includere altri elementi che potrebbero variare [VIM 3rd Edition,
UNI CEI 70099: 2008, 2.22].
Riproducibilità: Precisione in condizioni di riproducibilità [UNI ISO 5725-1:2004,
3.17] e [VIM 3rd Edition, UNI CEI 70099: 2008, 2.25].
Condizioni di riproducibilità: Condizioni nelle quali i risultati di prova vengono ottenuti con lo stesso metodo su entità di prova identiche, in laboratori differenti, con
diversi operatori e usando apparecchiature diverse [UNI ISO 5725-1:2004, 3.18],
oppure: Condizione di una misurazione, che assicura: differenti luoghi, operatori e
sistemi di misura, e l’esecuzione di misurazioni ripetute dello stesso oggetto, o di
oggetti simili [VIM 3rd Edition, UNI CEI 70099: 2008, 2.24].
NOTA: Differenti sistemi di misura possono far uso di differenti procedure di misura.
In chimica la condizione di riproducibilità non comprende la variazione della procedura.
Incertezza di misura: Parametro, associato al risultato di una misurazione, che caratterizza la dispersione dei valori ragionevolmente attribuibili al misurando [UNI CEI
ENV 13005:2000, 2.23), oppure: Parametro non negativo che caratterizza la dispersione dei valori che sono attribuiti a un misurando, sulla base delle informazioni
utilizzate [VIM 3rd Edition, UNI CEI 70099: 2008, 2.26].
NOTA: Il parametro può essere ad esempio uno scarto tipo (o un suo multiplo dato)
o la semiampiezza di un intervallo che abbia un livello di fiducia stabilito.
Analita: componente rappresentato nelle denominazione di una grandezza misurabile [UNI EN ISO 17511:2004, 3.2].
NOTA: Termine sconsigliato da [VIM 3rd Edition, UNI CEI 70099: 2008, 2.3].
Condizione di interesse; condizione obiettivo [CLSI EP12]: particolare malattia,
stadio di malattia, stato di salute o qualsiasi altra condizione identificabile o caratteristica interessante, come ad esempio lo stadio di una malattia già nota o una condizione di salute che comporti una immediata azione clinica, come l'avvio, la modifica o l'interruzione di un trattamento.
Controllo [CLSI EP12]; materiale di controllo: dispositivo, soluzione o preparato
liofilizzato destinato ad essere utilizzato nel processo di controllo di qualità
NOTA 1 La reazione o concentrazione attesa degli analiti di interesse è nota entro i
limiti accertati durante la preparazione e confermati prima dell'utilizzo.
NOTA 2 I materiali di controllo generalmente non sono utilizzati per la taratura nello
stesso processo in cui sono utilizzati come controllo.
Cut-off [CLSI EP12]: per una prova qualitativa, la soglia sopra la quale il risultato è
riportato come positivo e sotto la quale il risultato è riportato come negativo.
NOTA La concentrazione di cut-off identificata in questo documento come C50 è la
concentrazione di analitica in cui il 50% di una numerosa serie di risultati sono positivi.
DOCUMENTI TECNICI
Data: 2013-02-06
DT-07-DL/DS rev. 00
Pag. 40 di 47
Standard di riferimento stabilito [CLSI EP12] – il miglior metodo disponibile per
stabilire la presenza o lʼassenza della condizione o della caratteristica di interesse.
NOTA 1: Lo Standard di riferimento stabilito può essere una singola prova o un metodo, o una combinazione di metodi e tecniche, compreso il monitoraggio (followup) clinico (modificata da STARD).
NOTA 2: La parola “stabilito” (“designated”) è stata aggiunta al termine per sottolineare che lo standard di riferimento (come definito da STARD) evolverà con
lʼavanzamento dei sistemi analitici e potrà essere in certe situazioni differente da
uno standard di riferimento determinato da un ente regolatorio o metrologico.
NOTA 3: Uno Standard di riferimento stabilito divide la popolazione per la quale è
inteso solo in due gruppi e non considera lʼesito della prova candidata (la nuova
prova in valutazione). Uno Standard di riferimento stabilito può essere una combinazione di metodi dove lo standard è lʼalgoritmo che specifica la selezione e la sequenza di questi metodi e come I differenti risultati sono combinati per fornire una
classificazine finale positive/negativo.
NOTA 4: La definizione VIM93 per riferimento è differente, ovvero è espressa come
uno standard che generalmente possiede la più elevata qualità metrologica in un
dato contesto o in una certa organizzazione da cui sono derivate le misurazioni.
Accuratezza diagnostica: Grado di concordanza tra le informazioni dalla prova in
valutazione e lo standard di riferimento stabilito (modificata da STARD).
NOTA 1: L'accuratezza diagnostica può essere espressa in modi differenti, compreso le coppie sensibilità - specificità diagnostiche, le coppie del quoziente di probabilità e l'area sotto la curva caratteristica operativa (ROC).
NOTA 2: L'accuratezza diagnostica deve essere interpretata nel contesto con le
condizioni di interesse e/o lo standard di riferimento stabilito.
NOTA 3: Lʼaccuratezza diagnostica è differente accuratezza, che è la vicinanza del
singolo risultato di misura al valore (convenzionale) di riferimento [UNI ISO 5725:
2004].
Sensibilità diagnostica: Percentuale (frazione numerica moltiplicata per 100) di
soggetti nelle condizioni obiettivo (come determinate dallo standard di riferimento
stabilito) il cui valore di prova è positivo.
NOTA 1: Talora “Sensibilità diagnostica ” viene riferita ad una sola condizione clinica, mentre il concetto di condizione obiettivo ne può comprendere diverse.
NOTA 2: La condizione o caratteristica di interesse deve essere definita da criteri
indipendenti.
NOTA 3 Una stima della sensibilità diagnostica è calcolata come 100*TP/(TP+FN).
Specificità diagnostica: Percentuale (frazione numerica moltiplicata per 100) di
soggetti privi della condizione obiettivo (come determinata dallo standard di riferimento stabilito) il cui valore di prova è negativo.
NOTA 1 Talora “specificità diagnostica ” viene riferita ad una sola condizione clinica,
mentre il concetto di condizione obiettivo ne può comprendere diverse.
DOCUMENTI TECNICI
Data: 2013-02-06
DT-07-DL/DS rev. 00
Pag. 41 di 47
NOTA 2 La condizione o caratteristica di interesse deve essere definita da criteri indipendenti.
NOTA 3 Una stima della specificità diagnostica è calcolata come 100*TN/(FP+TN).
Efficienza: Percentuale (frazione numerica moltiplicata per 100) di risultati che sono
veri (corretti) , sia positivi che negativi; NOTA: una stima della efficienza è calcolata come 100×(TP+TN)/(TP+FP+FN+TN).
Risultato falso negativo // falso negativo: Risultato di prova negativo per un soggetto in cui la condizione di interesse è presente (come determinate dallo standard
di riferimento stabilito).
Risultato falso positivo // falso positivo: Risultato di prova positivo per un soggetto in cui la condizione di interesse è assente (come determinate dallo standard di
riferimento stabilito).
FN: Numero di risultati falsi negativi.
FP: Numero di risultati falsi positivi.
Limite del bianco (LoB): Risultato di misura più elevato che si può osservare (con
una probabilità definita) per un campione bianco.
NOTA 1 LoB non è una concentrazione reale di cui si ottengono misure; infatti, la
concentrazione reale a cui si garantisce un segnale positivo è chiamata limite di rilevazione. Parimenti, LoB è il valore atteso più basso per un campione che contiene
un livello di analita uguale a LoD con probabilità stabilita.
NOTA 2: Corrisponde al termine “limite inferiore di determinazione”; il risultato più
basso ottenuto da una procedura definita di misura che può essere data con una
certa incertezza.
NOTA 3 Altrimenti detto “valore critico” (UNI ISO 11843: 2009).
Limite di rivelazione (limit of detection, LoD): La più piccola quantità di analita in
un campione che può essere rivelata con una (stabilta) probabilità, sebbene forse
non quantificata come un valore esatto (modificata da WHO-BS/95.1793).
Misurando: Grandezza che sʼintende misurare [VIM 3rd Edition, UNI CEI 70099:
2008, 2.3].
Valore predittivo di un risultato negativo // valore predittivo negativo (NPV):
Percentuale (frazione numerica moltiplicata per 100) dei soggetti con un risultato di
prova negativo che non hanno la condizione obiettivo (come determinata dallo
standard di riferimento stabilito)
NOTA 1: NPV deve essere interpretato nel contesto con la prevalenza della condizione di interesse (come determinata dallo standard di riferimento stabilito).
NOTA 2: Una stima di NPV [con prevalenza stimata uguale a
100×(TP+FN)/(TP+FP+FN+TN)] è calcolata come 100xTN/(TN+FN).
DOCUMENTI TECNICI
Data: 2013-02-06
DT-07-DL/DS rev. 00
Pag. 42 di 47
Valore predittivo di un risultato positivo // valore predittivo positivo (PPV):
Percentuale (frazione numerica moltiplicata per 100) dei soggetti con un risultato di
prova positivo che hanno la condizione obiettivo (come determinata dallo standard
di riferimento stabilito).
NOTA 1 Il termine deve essere interpretato nel contesto con la prevalenza della
condizione di interesse (come determinata dallo standard di riferimento stabilito)
NOTA 2 Una stima di PPV [con prevalenza stimata uguale a
100×(TP+FN)/(TP+FP+FN+TN)] è calcolata come 100xTP/(TP+FP).
Prevalenza // prevalenza della condizione di interesse: La frequenza della condizione di interesse espressa come percentuale (frazione numerica moltiplicata per
100) del numero totale degli individui (quelli con la condizione più quelli senza la
condizione di interesse) nella popolazione oggetto dello studio.
NOTA
Una
stima
della
prevalenza
è
calcolata
come
100×(TP+FN)/(TP+FP+FN+TN).
Prove qualitative: I metodi candidati che forniscono sono due risposte categoriche
(ossia, positivo/negativo o si/no).
NOTA 1 Alcune prove qualitative non hanno valori numerici associati ai risultati; per
contro, alcune prove sono classificate come qualitative perché viene riportato solo
uno di due risultati (ossia positivo o negativo) ma questi risultati sono derivati dicotomizzando una scala quantitativa o ordinale.
NOTA 2 Una caratteristica distintiva delle prove qualitative è che hanno solo un
possibile punto decisionale medico, alla soglia cutoff.
Controllo di qualità (QC):parte della gestione della qualità dedicata alla conformità ai requisiti della qualità (ISO 9000).
NOTA 1 Il termine comprende le tecniche operative e le attività utilizzate per rispondere ai requisiti per la qualità.
NOTA 2 Nelle prove di laboratorio in ambito medico, l'insieme di procedure progettate per sorvegliare i metodi di prova ed i risultati per assicurare prestazioni appropriate dei sistemi analitici.
TN: Numero di risultati veri negativi.
TP: Numero di risultati veri positivi.
Popolazione obiettivo (target): Gli individui per i quali la prova è predisposta.
Vero negativo // risultato vero negativo: Risultato di prova negativo per un soggetto in cui la condizione di interesse è assente.
Vero positivo // risultato vero positivo: Risultato di prova positivo per un soggetto
in cui la condizione di interesse è presente.
DOCUMENTI TECNICI
Data: 2013-02-06
DT-07-DL/DS rev. 00
Pag. 43 di 47
Appendice C. Bibliografia di riferimento
A2LA. P103b – Annex: Policy on Estimating Measurement Uncertainty for Life Sciences Testing Labs. Date of Issue 18/10/2007.
B.M. Simonet. Quality control in qualitative analysis. TrAC Trends in Analytical
Chemistry. Volume 24, Issue 6, June 2005, Pages 525-531.
BIPM, IEC, IFCC, ISO, ILAC, IUPAC, IUPAP, OIML (2007) International vocabulary
of metrology—Basic and general concepts and associated terms. Vocabulaire international de me´trologie—Concepts fondamentaux et ge´ne´raux et termes associe´s, 3rd edn. Draft JCGM, Se`vres (abbreviated VIM3)
Bottazzini N. Il controllo e l'espressione dei risultati delle prove microbiologiche.
Seminario SINAL Novembre 2000.
C-NPU. Subcommittee on Nomenclature, Properties, and Units in Laboratory Medicine. Available from: URL: http://www.iupac.org/divisions/VII/VII.C.1/.
Caslavska J, Allemann D and Thormann W. Analysis of urinary drugs of abuse by a
multianalyte capillary electrophoretic immunoassay. Journal of Chromatography A,
Volume 838, Issues 1-2, 9 April 1999, Pages 197-211.
CEN/TC 251. EN 1614:2006 Health Informatics — Representation of dedicated
kinds of property in laboratory medicine.
Chinaka S, Iio R, Takayama N, Kodama S, and Hayakawac K. Chiral Capillary Electrophoresis of Amphetamine-Type Stimulants. Journal of Health Science, 52(6)
649–654 (2006).
Clinical and Laboratory Standards Institute. User Protocol for Evaluation of Qualitative Test Performance; Approved Guideline—Second Edition. CLSI document
EP12-A2 [ISBN 1-56238-000-0]. Clinical and Laboratory Standards Institute, 940
West Valley Road, Suite 1400, Wayne, Pennsylvania 19087-1898 USA, 2007.
Dybkaer R, Jørgensen K. Measurement, value, and scale. Scand J Clin Lab Invest
Suppl. 1989;194:69-76.
Dybkaer R. An Ontology on Property for physical, chemical, and biological systems.
Thesis. APMIS. 2004; 112(Suppl. no. 117):1–210.
DOCUMENTI TECNICI
Data: 2013-02-06
DT-07-DL/DS rev. 00
Pag. 44 di 47
Dybkaer R. Metrology and protometrology: the ordinal question. Accred Qual Assur
(2007) 12:553–557.
Dybkaer R. Scales for measurement based on an antigen-antibody reaction. Scand
J Clin Lab Invest Suppl. 1991;205:55-62.
EA - 4/10 — Accreditation in Microbiological Laboratories. July 2002 rev02.
EA 4/16 EA guidelines on the expression of uncertainty in quantitative testing.
December 2003 rev00.
Ellison SLR, Gregory S and Hardcastle WA. Quantifying uncertainty in qualitative
analysis. Analyst, May 1998, Vol. 123 (1155–1161).
Ellison SLR. Uncertainties in qualitative testing and analysis. Accred Qual Assur
(2000) 5:346–348
ENFSI. Standing Committee for Quality and Competence (QCC). Guidance for uncertainty of measurement in quantitative analyses or testing (UM). BPM QCC-UM001. Issue NO: 001. 4 November 2006.
EURACHEM/CITAC Guide: The Expression of Uncertainty in Qualitative Testing,
Committee Draft September 2003.
EURACHEM/CITAC Guide. Quantifying Uncertainty in Analytical Measurement.
Second edition 2000.
EURACHEM/CITAC
joint
working
group
on
http://www.eurachem.org/wgs/wg_qa.htm.
Qualitative
Analysis
Garcinuño RM, Fernández P, Pérez-Conde C, Gutiérrez AM, Cámara C. Development of a fluoroimmunosensor for theophylline using immobilised antibody. Talanta.
2000 Aug 16;52(5):825-32.
Giraud S, Robinson N, Mangin P, Saugy M. Scientific and forensic standards for
homologous blood transfusion anti-doping analyses. Forensic Science International
179 (2008) 23–33.
Grimaldi R. Corso di Metodologia della Ricerca Sociale. I livelli di scala.
http://www.cisi.unito.it/progetti/leda/cap3a.htm.
Iio R, Chinaka S, Takayama N, and Hayakawa K. Simultaneous Chiral Analysis of
Methamphetamine and Related. Compounds by Capillary Electrophoresis/Mass
DOCUMENTI TECNICI
Data: 2013-02-06
DT-07-DL/DS rev. 00
Pag. 45 di 47
Spectrometry Using Anionic Cyclodextrin. Analytical Sciences. January 2005,
2005;21:15-9.
Istituto Superiore di Sanità. Quantificazione dellʼincertezza nelle misure analitiche.
Seconda edizione (2000) della Guida EURACHEM / CITAC CG 4. Traduzione
italiana a cura di Marina Patriarca, Ferdinando Chiodo, Federica Corsetti, Barbara
Rossi, Antonio Menditto, Michela Sega e Margherita Plassa 2003, vi, 119 p.
Rapporti ISTISAN 03/30.
Jarvis B, Corry J.E.L. and Hedges A.J.. Estimates of measurement uncertainty from
proficiency testing schemes, internal laboratory quality monitoring and during routine enforcement examination of foods. of Applied Microbiology 103 (2007) 462–
467.
Lombard B. Estimation of measurement uncertainty in food microbiology: The ISO
approach. Accred Qual Assur (2006) 17: 94–100.
MEQUALAN.Straight
answers
from
qualitative
chemical
http://ec.europa.eu/research/growth/gcc/projects/mequalan.html.
analysis
Pulido A Ruisanchez AI, Boqué R, Rius FX, Analytica Chimica Acta, 455 (2002)
267-275.
Rapillo M. Gli scarti..."tipi"...facili. Dove si narra dell' utilizzo di excel per il calcolo
della ripetibilità e dell' incertezza delle misure variabili con la concentrazione.
Gangemi: 2008.
Ríos1 A., Barceló D, Buydens L, S. Cárdenas S, Heydorn K, Karlberg B, Klemm K,
Lendl B, Milman B, Neidhart B, Stephany RW, Townshend1 A, Zschunke A and
Valcárcel1 M. Quality assurance of qualitative analysis in the framework of the
European project ʼMEQUALANʼ . Accreditation and Quality Assurance: Journal for
Quality, Comparability and Reliability in Chemical Measurement. Volume 8, Number
2 / February, 2003 Pages 68-77.
S.L.R. Ellison, a, and T. Fearna. Characterising the performance of qualitative analytical methods: Statistics and terminology. TrAC Trends in Analytical Chemistry.
Volume 24, Issue 6, June 2005, Pages 468-476.
Sanford J. Doping of Racehorses. Br J Sports Med.1974; 8: 176-180.
SINAL DT-0002, Guida per la valutazione e lʼespressione dellʼincertezza nelle misurazioni. Rev.1, febbraio 2000.
STARD. Standards for the Reporting of Diagnostic accuracy studies. http://stardstatement.org/ . Last update 22 April 2008.
DOCUMENTI TECNICI
Data: 2013-02-06
DT-07-DL/DS rev. 00
Pag. 46 di 47
Stevens S.S. On the Theory of Scales of Measurement. Science 7 June 1946: Vol.
103. no. 2684, pp. 677 – 680. DOI: 10.1126/science.103.2684.677.
United States Equestrian Federation®. Equine Drugs and Medications Program.
3760 Ridge Mill Drive, Hilliard, Ohio 43026. Drugs and medications guidelines. Last
revised august 1, 2007.
WADA . Harmonization of the method for the identification of epoetin alfa and beta
(rEPO) and darbepoetin alfa (NESP) by ief-double blotting and chemiluminescent
detection. WADA Technical Document – TD2007EPO.
Wayne Dimech1,a, Barbara Francis1, Jennifer Kox2, Graham Roberts2 for the Serology Uncertainty of Measurement Working Party . Calculating Uncertainty of
Measurement for Serology Assays by Use of Precision and Bias. Clinical Chemistry.
2006;52:526-529.
DOCUMENTI TECNICI
Data: 2013-02-06
DT-07-DL/DS rev. 00
Pag. 47 di 47