Metodologie informatiche per la chimica Dr. Sergio Brutti Metodologie di analisi dei dati IV Intervallo massimo e semidispersione L’uso del valore centrale dell’intervallo massimo e della semidispersione come stimatori del valore di una misura e della sua incertezza implicano alcuni significati statistici Nel nostro caso la misura è data dal valore 0.097 ± 0.005 s L’aver accettato come valore dell’incertezza la semidispersione massima significa aver sovrastimato l’incertezza. Il valore centrale sarebbe identico anche se le 28 misure ripetute avessero dato (1) valore a 0.092 e (27) valori a 0.102. Il valore più ragionevole per la sua incertezza è decisamente minore di 0.005 (ovvero della semidispersione) Trattazione statistica L’analisi riportata dei dati tabellati è quindi inaccurata e piuttosto pessimistica. Una trattazione statistica consente di dare valutazioni migliori In questo caso però la rappresentazione corretta dei dati passa attraverso un diagramma di frequenze. Classi I dati della tabella devono essere divisi in classi (da riportare sull’asse x) ovvero in intervalli entro i quali cadono le diverse misure. Nel nostro caso le misure sono state raggruppate in 11 classi che cadono negli intervalli centrati sui dati a partire da 0.092 fino a 0.102 con incremento da una classe al’altra di 0.001 corrispondenti ad ampiezze di ogni classe di ±0.0005 Es. classe 1 =0.0915-0.0925 Classe 2 0.0925-0.0935 ….. Frequenze Di ogni classe è necessario calcolare la frequenza (da riportare sull’asse x) ovvero calcolare il rapporto tra il numero di misure che sono comprese in una data classe e il numero totale di misure. Nel nostro caso nella classe 1 compresa tra 0.0915 e 0.0925 cade 1 sola misura. Il numero totale delle misure è 28 e quindi la frequenza della classe 1 sarà: 1 f Cl.1 0.036 28 Analisi statistica Il grafico a istogrammi (diagramma di frequenze) mostra molte informazioni riguardo le misure realizzate. Nel nostro caso è possibile osservare che le misure non si distribuiscono uniformemente tra tutte le classi e che esistono classi più probabili e classi meno probabili. A partire da questa analisi si può effettuare una trattazione accurata dei dati per ricavare una stima della misura e l’incertezza associata. Stimatori del valor vero Data una distribuzione di valori di misure ripetute è possibile utilizzare vari strumenti statistici per stimare il valor vero. Valore centrale – valore medio tra il massimo e il minimo dell’intervallo delle misure Moda – valore più ricorrente tra N misure Mediana – valore che occupa la posizione centrale in un insieme di numeri e rispetto al quale metà dei numeri ha valore superiore e l'altra metà ha valore inferiore Media armonica – il reciproco della media aritmetica dei reciproci Media geometrica – radice N-esima del prodotto di N misure Media – media aritmetica di N misure Stimatori del valor vero: valore centrale Il valore centrale è il valore medio tra il massimo e il minimo dell’intervallo delle misure M max M min Valore centrale 2 0.102 0.092 v.c. 0.097 s 2 Stimatori del valor vero: moda La moda è il valore più ricorrente tra N misure moda M freq max moda 0.096 Stimatori del valor vero: mediana La mediana è il valore che occupa la posizione centrale in un insieme di numeri e rispetto al quale metà dei numeri ha valore superiore e l'altra metà ha valore inferiore mediana v.c. 1 M , 1 M 2 2 i mediana 0.097 i Stimatori del valor vero: media armonica La media armonica è il reciproco della media aritmetica dei reciproci media armonica M . A. M . A. 1 1 1 N i Mi media armonica 0.09676 Stimatori del valor vero: media geometrica La media geometrica è radice N-esima del prodotto di N misure media geometrica M .G. N M .G. N M i i 1 media geometrica 0.09679 Stimatori del valor vero: media artmetica La media aritmetica è il rapporto tra la sommatoria delle misure e il loro numero media aritmetica m N m M i 1 i N media aritmetica 0.09682 Stimatori del valor vero Nel nostro esempio i vari stimatori del valor vero danno valori differenti. Quale va adottato? Valore centrale – 0.097 s Moda – 0.096 s Mediana – 0.097 s Media armonica – 0.09676 s Media geometrica – 0.09679 s Media – 0.09682 s Stimatori del valor vero Consideriamo la sensibilità dello strumento: 0.001 s I valori vanno riportati con il corretto numero di cifre significative considerando la semidispersione ± 0.0005 Valore centrale – 0.0970 s Moda – 0.0960 s Mediana – 0.0970 s Media armonica – 0.0968 s Media geometrica – 0.0968 s Media – 0.0968 s