TRATTAMENTO DEI DATI ANALITICI Fasi di una analisi quantitativa Selezione del metodo di analisi Campionamento Preparazione di un campione da laboratorio Definizione dei campioni replicati Analisi replicate, contemporaneamente e con lo stesso metodo, su porzioni dello stesso campione Preparazione delle soluzioni dei campioni Eliminazione delle interferenze Calibrazione e misura Calcolo dei risultati Valutazione dell’attendibilità dei dati analitici Errori nell’analisi chimica E’ impossibile eseguire un’analisi chimica in modo che i risultati siano assolutamente privi di errori o incertezze Gli errori sperimentali si combinano tra loro in modo da rendere ogni nuova misura più o meno diversa dalla precedente L’incertezza della misura sperimentale non può mai essere eliminata completamente perciò il valore vero di una quantità è sempre sconosciuto L’entità probabile dell’errore può essere valutata e si possono definire i limiti entro cui ricade, con un determinato grado di probabilità, il valore vero di una quantità misurata E’ sempre indispensabile effettuare una stima dell’affidabilità dei dati sperimentali anche se la stima dell’accuratezza dei dati sperimentali non è sempre facile Stima dell’accuratezza dei dati analitici Ogni volta che collezioniamo i risultati di un’analisi è necessario stimarne precisione ed accuratezza Dati con precisione ed accuratezza ignote sono privi di significato D'altro canto, anche risultati che non sono particolarmente accurati possono essere di considerevole valore se sono noti i limiti di incertezza Una delle domande a cui rispondere prima di cominciare un'analisi è: "qual è il massimo errore tollerabile nel risultato” La risposta a questo quesito determina il tempo richiesto per il lavoro: un aumento consistente dell'accuratezza può richiedere ore, giorni, e persino settimane di lavoro aggiuntivo Media aritmetica o media ( x) N di N valori sperimentali x x i 1 N media 18,30 18,40 18,50 18,60 18,70 i Mediana Il risultato centrale dei dati replicati ordinati Nel caso di un numero pari di dati replicati si calcola la media della coppia centrale 1 2 3 4 5 6 x 18,45 111,52 18,53 N 6 18,58 media 18,59 18,63 mediana 18,61 18,65 18,68 mediana media 18,30 18,40 18,50 18,60 18,70 Precisione La dispersione dei valori misurati intorno al valore medio Descrive il grado di riproducibilità delle misure ed è una funzione della deviazione dei dati dalla media di = xi - xm Grandezze utilizzate per indicare la precisione di una serie di dati replicati: deviazione standard varianza coefficiente di variazione Accuratezza Rappresenta lo scostamento tra il valore ottenuto ed il valore vero o accettato In altri termini è una misura della bontà dell’accordo tra il risultato, xi, o il valore medio dei risultati di un’analisi, ed il valore vero o supposto tale, x0. E’ espressa dall’ errore assoluto E = xi – x0 o dall’ errore relativo Er = (xi – x0)/ x0 × 100 Alta accuratezza Alta precisione Bassa accuratezza Alta precisione Alta accuratezza Bassa precisione Bassa accuratezza Bassa precisione Categorie di errori nei dati sperimentali Errore grossolano (o occasionale) Si verifica occasionalmente, è spesso grande e provoca un significativo scostamento di un singolo dato (outlier) da tutti gli altri x0 18,30 18,40 18,50 18,60 18,70 Outlier Può capitare, nel corso di una misura, di avere un valore che si discosta significativamente da tutti gli altri dati replicati (outlier) E’ necessario stabilire se il valore ottenuto deve essere utilizzato per il calcolo della media oppure se va considerato un dato anomalo e quindi scartato (Q-test) La scelta va fatta seguendo uno dei criteri codificati ed accettati Categorie di errori nei dati sperimentali Errore sistematico (o determinato) Causa lo scostamento della media di un set di dati sperimentali dal valore vero (o accettato) Influenza l’ accuratezza di una misura xm 18,30 18,40 18,50 x0 18,60 18,70 Errori sistematici Gli errori sistematici hanno un valore definito ed una causa identificabile. Per misure replicate effettuate nello steso modo hanno lo stesso ordine di grandezza e generalmente influenzano tutti i risultati di un set di misura allo stesso modo. Provocano uno scostamento unidirezionale dal valore vero che può essere costante o proporzionale e che può assumere valore sia positivo che negativo. Gli errori sistematici introducono un bias nella tecnica di misura. Cause degli errori sistematici Errori strumentali: dovuti a imperfezioni e malfunzionamento degli strumenti di misura Variazioni di temperatura Contaminazione dell’equipaggiamento Fluttuazioni nella tensione di alimentazione Guasto o malfunzionamento di componenti Errori di metodo: dovuti a comportamento chimico o fisico non ideale dei reagenti e delle reazioni utilizzate in un procedimento analitico Errori personali: causati da valutazioni personali dell’analista nel corso del procedimento analitico adottato Rivelazione e correzione degli errori sistematici Analisi di campioni standard Analisi con metodi indipendenti Variazioni della quantità di campione Calibrazione Rivelazione e correzione degli errori sistematici xm x0 18,30 18,40 18,50 18,60 standard 18,70 xm 18,30 18,40 18,50 x0 18,60 18,70 Analisi di Calibrazione Categorie di errori nei dati sperimentali Errore casuale (o indeterminato) Provoca la dispersione dei dati sperimentali intorno al valore medio. Riflette la precisione di una misura xm 18,30 18,40 x0 18,50 xm x0 18,60 18,70 18,30 18,40 18,50 18,60 18,70 18 ERRORI CASUALI Gli errori casuali (detti anche indeterminati o "random" in lingua inglese), causano una dispersione più o meno simmetrica dei dati intorno al valore medio Essi sono legati a fluttuazioni indefinite di una miriade di parametri sperimentali, quali temperatura, pH, pressione, umidità, punto d’arresto di una titolazione, forza ionica, ecc. oltre che alle tolleranze dei pesi delle bilance e della vetreria utilizzata per la misurazione di volumi e alle incertezze dei valori desunti dagli strumenti di misura. Queste fluttuazioni avvengono anche cercando di lavorare con la massima cura. Gli errori casuali non possono essere eliminati, anche se possono essere ridotti operando con cura. Trattamento Statistico dell’Errore Casuale E’ possibile valutare gli errori casuali (o indeterminati) nei risultati di un’analisi con metodi statistici. Il Campione e la Popolazione Un numero finito di osservazioni sperimentali viene definito un campione di dati. Questo è trattato come una frazione di un numero infinito di osservazioni Il numero infinito di dati è definito una popolazione o universo di dati Le leggi statistiche sono derivate per una popolazione di dati. Se applicate ad un campione di dati possono richiedere modifiche, poiché un numero finito e limitato di dati può non essere rappresentativo dell’intera popolazione. L’analisi statistica dei dati analitici è basata sull’assunzione che gli errori casuali in un’analisi seguano una curva di distribuzione Gaussiana o normale. Proprietà di una curva Gaussiana 2 1 x 2 / 2 y( x , ) e 2 Frequenza relativa (y) delle deviazioni della popolazione di dati (x-) dalla media = media popolazione della = deviazione standard della popolazione Il 68,3% dei dati di una popolazione ricade nell’intervallo Il 95,5% dei dati di una popolazione ricade nell’intervallo 2 e il 97,7% nell’intervallo 3 La media della popolazione e la media del campione xm o x E’ opportuno comprendere la differenza tra media del campione e media della popolazione N media del campione media relativa ad un campione limitato di dati x quando N è piccolo x i 1 i N N media della popolazione media reale relativa ad una popolazione illimitata di dati quando N x i 1 N i • Spesso, se N è piccolo, xm differisce da perché un piccolo campione di dati può non rappresentare correttamente la sua popolazione • La differenza tra xm e diminuisce rapidamente con l’aumento del numero di misure (N) che costituiscono il campione • In generale, se N assume valori tra 20 e 30, o superiori, la differenza risulta trascurabile La deviazione standard della popolazione La deviazione standard della popolazione () è una misura della precisione di una popolazione di dati N x i 1 i N 2 La deviazione standard del campione (s) è un indicatore della precisione della misura x x N s i 1 2 i N 1 • La grandezza (N-1) è chiamata numero di gradi di libertà • Indica il numero di dati indipendenti che vengono usati per il calcolo della deviazione standard di un campione di dati • Nel calcolo della deviazione standard di piccoli campioni di dati l’uso di N al posto di (N-1) non è corretto e comporta un errore nel calcolo della deviazione standard s