Dr Carlo Meneghini Confronto dati sperimentali e distribuzioni

Principali distribuzioni di probabilità discrete
Corso Integrato di Statistica Informatica e
Analisi dei dati
Binomiale
Dr Carlo Meneghini
Dip. di Fisica “E. Amaldi”
via della Vasca Navale 84
[email protected]
http://webusers.fis.uniroma3.it/~meneghini
Confronto dati sperimentali e
distribuzioni teoriche di probabilità
C.I. - statistica, informatica e analisi
dei dati sperimentali
1
C.I. - statistica, informatica e analisi
dei dati sperimentali
2
Principali distribuzioni di probabilità discrete
Distribuzioni di probabilità continue
Poisson
F(x) = funzione di distribuzione di probabilità
Probabilità di osservare un valore della variabile X tra xa e xb
p(x) = funzione di densità di probabilità
p(x)dx = probabilità di osservare un valore della variabile X compreso tra x e x+dx
dx
C.I. - statistica, informatica e analisi
dei dati sperimentali
3
Principali distribuzioni di probabilità continue
Uniforme
C.I. - statistica, informatica e analisi
dei dati sperimentali
4
Principali distribuzioni di probabilità continue
Gauss (Normale)
µ−σ
C.I. - statistica, informatica e analisi
dei dati sperimentali
5
C.I. - statistica, informatica e analisi
dei dati sperimentali
µ
µ+σ
6
1
Principali distribuzioni di probabilità continue
Gauss (Normale)
Istogramma:
Right-click
L’area del rettangolo
rappresenta la frequenza
di una classe, l’altezza la
densità di frequenza.
Il centro della base
rappresenta il valore di
riferimento.
C.I. - statistica, informatica e analisi
dei dati sperimentali
7
incertezza di misura
C.I. - statistica, informatica e analisi
dei dati sperimentali
8
incertezza di misura
La funzione di distribuzione binomiale è la funzione di
distribuzione da cui provengono le frequenze di un
istogramma costruito a partire dalle misure sperimentali.
La funzione di distribuzione binomiale è la funzione di
distribuzione da cui provengono le frequenze di un
istogramma costruito a partire dalle misure sperimentali.
In questo caso
Il numero totale di prove: NT = 30
Consideriamo successo il fatto di osservare un valore
nella classe 5 e insuccesso qualunque altro valore
Il numero di volte che abbiamo osservato il valore 5 è 3
quindi, in base ai dati sperimentali la probabilità di
successo è:
p5 =3/NT = 0.1
In base ai dati sperimentali il numero di volte
che è lecito aspettarsi di trovare 5 fagioli neri
pescando NT fagioli è (valore atteso)
µ = N p5
L’incertezza è:
σ2 = N p5 (1-p5 )
E' lecito aspettarsi che, ripetendo l'esperimento, le
osservazioni sperimentali siano distribuite intorno al
valore vero e che queste siano più frequenti
nell'intervallo µ−σ, µ+σ
La deviazione standard σ è l'incertezza standard sul
valore osservato.
C.I. - statistica, informatica e analisi
dei dati sperimentali
9
L'incertezza standard sul numero di sul valore osservato in una data
classe è σi
Dati
sperimentali
Riepilogo
Statistiche
C.I. - statistica, informatica e analisi
dei dati sperimentali
µ
10
incertezza di misura
L'incertezza standard sul numero di sul valore osservato in una
data classe è σi
Istogramma di frequenze
Right-click
Ni
C.I. - statistica, informatica e analisi
dei dati sperimentali
11
C.I. - statistica, informatica e analisi
dei dati sperimentali
12
2
Confronto dati sperimentali e distribuzioni
teoriche
Confronto dati sperimentali e distribuzioni
teoriche
Distribuzioni discrete
Problema:
Confrontare la distribuzione sperimentale (N dati con distribuzione di frequenze assolute
Ni) con la distribuzione teorica di probabilità P(x). Una volta costruito l'istogramma di
frequenze sperimentali:
A
B
Calcolare la distribuzione delle frequenze
relative fexp
Calcolare l'incertezza sulle frequenze
assolute:
Calcolare l'incertezza sulle frequenze
assolute:
Calcolare le frequenze assolute teoriche:
Calcolare l'incertezza sulle frequenze
relative
NTh=piNT
Riportare sul grafico NTh e Ni con le
incertezze di misura
Riportare sul grafico P(x) e fexp
con le
C.I. - statistica, informatica e analisi
incertezze di misura
dei dati sperimentali
13
Confronto dati sperimentali e distribuzioni teoriche:
classi con più di un carattere (valore)
Dati
sperimentali
C.I. - statistica, informatica e analisi
dei dati sperimentali
14
Confronto dati sperimentali e distribuzioni teoriche:
distribuzioni continue
Riepilogo
Statistiche
Per una la classe i-esima la funzione
FREQUENZA di Excel calcola
Per una distribuzione continua la probabilità associata
ad un intervallo di valori (classe) si calcola a partire
dalla distribuzione integrata:
F(i) - F(i-1) = Ni-Ni-1
P(xa<X<xb) = F(xb) - F(xa)
Questo valore deve essere
confrontato con la Pb di osservare
il valore i-esimo oppure i-1 esimo
C.I. - statistica, informatica e analisi
Vedere
l'esempio nel file: confronto2.xls
dei dati sperimentali
15
C.I. - statistica, informatica e analisi
Vedere dei
l'esempio
nel file: confronto3.xls
dati sperimentali
16
3