Metodologie informatiche per la chimica

Metodologie informatiche per la
chimica
Dr. Sergio Brutti
Metodologie di analisi dei dati IV
Intervallo massimo e semidispersione
L’uso del valore centrale dell’intervallo massimo e della
semidispersione come stimatori del valore di una misura e della sua
incertezza implicano alcuni significati statistici
Nel nostro caso la misura è data dal valore
0.097 ± 0.005 s
L’aver accettato come valore dell’incertezza la semidispersione
massima significa aver sovrastimato l’incertezza.
Il
valore
centrale
sarebbe
identico anche se le 28 misure
ripetute avessero dato (1) valore
a 0.092 e (27) valori a 0.102.
Il valore più ragionevole
per la sua incertezza è
decisamente minore di
0.005
(ovvero
della
semidispersione)
Trattazione statistica
L’analisi riportata dei dati tabellati è quindi inaccurata e piuttosto
pessimistica. Una trattazione statistica consente di dare valutazioni
migliori
In questo caso però la rappresentazione corretta dei dati passa
attraverso un diagramma di frequenze.
Classi
I dati della tabella devono essere divisi in classi (da riportare
sull’asse x) ovvero in intervalli entro i quali cadono le diverse
misure.
Nel nostro caso le misure
sono state raggruppate in 11
classi che cadono negli
intervalli centrati sui dati a
partire da 0.092 fino a 0.102
con incremento da una classe
al’altra di 0.001 corrispondenti
ad ampiezze di ogni classe di
±0.0005
Es. classe 1 =0.0915-0.0925
Classe 2 0.0925-0.0935
…..
Frequenze
Di ogni classe è necessario calcolare la frequenza (da riportare
sull’asse x) ovvero calcolare il rapporto tra il numero di misure che
sono comprese in una data classe e il numero totale di misure.
Nel nostro caso nella classe 1
compresa tra 0.0915 e 0.0925
cade 1 sola misura. Il numero
totale delle misure è 28 e
quindi la frequenza della
classe 1 sarà:
1
f Cl.1 
 0.036
28
Analisi statistica
Il grafico a istogrammi (diagramma di frequenze) mostra molte
informazioni riguardo le misure realizzate.
Nel nostro caso è possibile
osservare che le misure non
si distribuiscono
uniformemente tra tutte le
classi e che esistono classi
più probabili e classi meno
probabili.
A partire da questa analisi
si può effettuare una
trattazione accurata dei dati
per ricavare una stima della
misura e l’incertezza
associata.
Stimatori del valor vero
Data una distribuzione di valori di misure ripetute è possibile
utilizzare vari strumenti statistici per stimare il valor vero.
Valore centrale – valore medio tra il massimo e il minimo dell’intervallo
delle misure
Moda – valore più ricorrente tra N misure
Mediana – valore che occupa la posizione centrale in un insieme di
numeri e rispetto al quale metà dei numeri ha valore superiore e l'altra metà
ha valore inferiore
Media armonica – il reciproco della media aritmetica dei reciproci
Media geometrica – radice N-esima del prodotto di N misure
Media – media aritmetica di N misure
Stimatori del valor vero: valore centrale
Il valore centrale è il valore medio tra il massimo e il minimo dell’intervallo
delle misure
M max  M min
Valore centrale 
2
0.102  0.092
v.c. 
 0.097 s
2
Stimatori del valor vero: moda
La moda è il valore più ricorrente tra N misure
moda  M  freq  max 
moda  0.096
Stimatori del valor vero: mediana
La mediana è il valore che occupa la posizione centrale in un insieme di
numeri e rispetto al quale metà dei numeri ha valore superiore e l'altra
metà ha valore inferiore

mediana  v.c.  1

M ,  1 M 
2
2
i
mediana  0.097
i
Stimatori del valor vero: media armonica
La media armonica è il reciproco della media aritmetica dei reciproci
media armonica  M . A.
M . A. 
1
1
1

N i Mi
media armonica  0.09676
Stimatori del valor vero: media geometrica
La media geometrica è radice N-esima del prodotto di N misure
media geometrica  M .G.
N
M .G.  N  M i
i 1
media geometrica  0.09679
Stimatori del valor vero: media artmetica
La media aritmetica è il rapporto tra la sommatoria delle misure e il loro
numero
media aritmetica  m
N
m
M
i 1
i
N
media aritmetica  0.09682
Stimatori del valor vero
Nel nostro esempio i vari stimatori del valor vero danno valori
differenti. Quale va adottato?
Valore centrale – 0.097 s
Moda – 0.096 s
Mediana – 0.097 s
Media armonica – 0.09676 s
Media geometrica – 0.09679 s
Media – 0.09682 s
Stimatori del valor vero
Consideriamo la sensibilità dello strumento: 0.001 s
I valori vanno riportati con il corretto numero di cifre significative
considerando la semidispersione
± 0.0005
Valore centrale – 0.0970 s
Moda – 0.0960 s
Mediana – 0.0970 s
Media armonica – 0.0968 s
Media geometrica – 0.0968 s
Media – 0.0968 s