19/09/2014
Richiami Statistica
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Università degli Studi di Cagliari
D.I.M.C.M.
Richiami Statistica
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Dati grezzi, serie di dati e campo di variazione
o Dati grezzi: dati raccolti non ordinati.
Esempio: temperature registrate giornalmente in
una certa località.
o Serie: ordinamento di dati numerici grezzi in ordine
crescente o decrescente.
o Campo di variazione dei dati: differenza fra il
numero più grande e quello più piccolo.
Richiami di statistica
Prof. Ing. Maria Teresa Pilloni
2
Richiami Statistica
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Frequenza di una classe –
Distribuzione di frequenza
Richiami Statistica
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Limiti di una classe – Ampiezza – Valore centrale
o “Limiti della classe”: ‘estremi’ della classe.
o Ampiezza della classe: differenza fra il confine
inferiore e il confine superiore. Gli intervalli possono o
meno avere tutti la stessa ampiezza.
o Valore centrale di una classe: semisomma dei limiti
inferiore e superiore della classe.
o I dati grezzi vengono distribuiti in classi.
o Frequenza della classe: numero di individui
appartenenti a ciascuna classe.
o Distribuzione di frequenze: ordinamento tabulare
che riporti le singole classi di dati e, in
corrispondenza, le relative frequenze di ogni classe.
3
4
1
19/09/2014
Richiami Statistica
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Richiami Statistica
Passi per costruire una distribuzione di frequenza
Istogrammi
1.
Determinare il più grande e il più piccolo fra i dati
grezzi, e trovare quindi il campo di variazione;
2. Dividere il campo di variazione in un numero
conveniente di classi della stessa ampiezza
(numero generalmente compreso fra 5 e 20);
3. Determinare il numero di osservazioni che
ricadono all’interno di ciascuna classe ⇒ la
frequenza delle classi.
Istogramma: grafico costituito da rettangoli con
base sull’asse orizzontale, centro sul valore centrale
della classe, lunghezza pari all’ampiezza della
classe, area proporzionale alla frequenza della
classe.
Classi di uguale ampiezza ⇒ altezza dei rettangoli
proporzionale alla frequenza delle classi.
5
Richiami Statistica
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
6
Richiami Statistica
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Frequenza relativa –
Distribuzione di frequenze relative
Poligoni di frequenza
o Frequenza relativa di una classe: frequenza della
classe/totale delle frequenza di tutte le classi; é
espressa come percentuale.
o “Distribuzione di frequenze relative”: si ottiene
sostituendo le frequenze di ciascuna classe con le
corrispondenti frequenze relative;
o Frequenza cumulativa: frequenza totale di tutti i
valori inferiori al confine superiore di una data
classe (include anche la classe considerata).
Poligono di frequenza: grafico lineare delle
frequenze delle classi passante per i valori
centrali delle classi.
Può essere ottenuto unendo i punti di mezzo dei
lati superiori dei rettangoli di un istogramma.
7
8
2
19/09/2014
Richiami Statistica
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Richiami Statistica
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Ogiva – Frequenze relative cumulative –
Curve di frequenza
1. “Poligono delle frequenze cumulate”, o “ogiva”:
grafico che riporta la frequenza cumulata
passando per i confini superiori delle classi.
2. Frequenze cumulate relative o frequenze cumulate
percentuali: frequenze cumulate divise per le
frequenze totali.
3. Riducendo l’ampiezza delle classi, si hanno
segmenti piccoli che possono approssimare delle
curve: si parla allora di curve di frequenza e di
curve di frequenza relativa.
9
Richiami Statistica
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
11
10
Richiami Statistica
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
12
3
19/09/2014
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Richiami Statistica
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Richiami Statistica
Media di una distribuzione
1. La media è un valore rappresentativo di un
insieme di dati.
2. Si possono definire diversi tipi di medie:
a)
b)
c)
d)
e)
13
13
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Richiami Statistica
Media aritmetica
x
∑
x=
N
j
Media aritmetica
Mediana
Moda
Media geometrica
Media armonica
14
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Richiami Statistica
Media aritmetica ponderata
f
∑
x=
j
Media aritmetica: se ai numeri x1, … , xj sono associabili
dei pesi w1, … , wj, che ne definiscono l’importanza,
allora la media ponderata vale:
xj
wx
∑
x=
∑w
N
j
fj : frequenze con cui compaiono le xj
j
j
15
16
4
19/09/2014
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Richiami Statistica
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Richiami Statistica
Media aritmetica: proprietà
a) Somma algebrica delle differenze tra un insieme di
numeri e la loro media aritmetica vale zero.
b) Somma dei quadrati delle differenze fra un insieme
di numeri Xj e un qualsiasi numero a è minima se e
solo se a=media aritmetica.
c) Se f1 numeri hanno media m1, f2 numeri hanno
media m2, .... , fK numeri hanno media mK, la media di
tutti i numeri è una media aritmetica ponderata di
tutte le medie.
17
18
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Richiami Statistica
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Richiami Statistica
Mediana
Mediana
La mediana di un insieme di numeri ordinati è il
valore centrale oppure la media aritmetica dei due
valori centrali.
1.
PdV geometrico: è il valore di ascissa
corrispondente alla linea verticale che divide un
istogramma in due parti di uguale area.
Esempio 1: l’insieme di numeri: 3, 4, 4, 5, 6, 8, 8, 8, 10 ha
mediana 6.
Esempio 2: l’insieme di numeri: 5, 5, 7, 9, 11, 12, 15, 18 ha
mediana (9+11)/2=10.
19
20
5
19/09/2014
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Richiami Statistica
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Richiami Statistica
La mediana
Mediana
2. E’ sostituita alla media aritmetica se:
Esempio: in tabella sono riportati i dati di costo di una
certa operazione industriale:
•
•
•
i dati sperimentali sono pochi
i dati sono ammassati verso un estremo
esiste il rischio di valori anomali o aberranti
In
tali casi la media aritmetica non è
rappresentativa,
essendo
fortemente
influenzata, all’opposto della mediana, dai
valori estremi.
COSTI
fi
24
4.08
2.16
1.68
1.44
.96
.6
1
1
1
1
3
2
4
22
21
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Richiami Statistica
Mediana
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Richiami Statistica
Mediana
Media aritmetica: 3.12, ma ben 11 dei 13 dati del
campione sono al di sotto di 3.12!
Nel nostro caso basta togliere il primo dato (24) per
far crollare la media da 3.12 a 1.
⇒ la media aritmetica, non è sempre la misura più
rappresentativa della tendenza centrale: le manca la
proprietà di essere resistente ai cambi!!
La mediana invece ha la proprietà di essere
resistente ai cambi.
La statistica non è resistente se, cambiando pochi dati
del campione, il valore della grandezza viene
alterato in modo sostanziale.
23
Nel nostro caso, la mediana coincide con il dato al
settimo posto, (i dati sono ordinati), cioè 1.44.
24
6
19/09/2014
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Richiami Statistica
Mediana
Moda
Moda: è il valore che si presenta con la più alta
frequenza, cioè il valore più comune.
Anche togliendo il valore estremo, 24, la mediana
scenderebbe alla semisomma dei valori in 6A e 7A
posizione, cioè (1.44+0.96)/2=1.2, restando quindi
ampiamente rappresentativa della tendenza
centrale del campione in esame.
La moda può non esistere, e, anche se esiste, può
non essere unica.
26
25
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Richiami Statistica
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Richiami Statistica
Richiami Statistica
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Moda
Esempio 1 : l’insieme di numeri 2, 2, 5, 7, 9, 9, 9, 10,
10, 11, 12, 18 ha moda 9.
Esempio 2 : l’insieme di numeri: 3, 5, 8, 10, 12, 15, 16
non ha moda.
Esempio 3 : l’insieme di numeri: 2, 3, 4, 4, 4, 5, 5, 7, 7,
7, 9 ha due mode, che sono 4 e 7, ed è detto
bimodale.
Distribuzione con una moda: unimodale.
27
28
7
19/09/2014
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Richiami Statistica
Media geometrica G
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Richiami Statistica
Media armonica H
Media geometrica G di un insieme di N numeri X1, X2,
... , XN: radice ennesima del prodotto dei numeri:
Media armonica H di un insieme di N numeri X1, X2, ... ,
XN : reciproco della media aritmetica dei reciproci dei
numeri stessi:
1
1
H=
G = x1 * x2 * ....... * xN
N
N ∑ j =1
N
=
1
xj
N
1
∑x
j
29
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Richiami Statistica
X2 =
Richiami Statistica
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Misure di dispersione di una distribuzione
Media quadratica
∑ xj
30
Dispersione o variazione dei dati: attitudine di certi
dati numerici a disporsi attorno ad un valore medio.
2
Esistono tre sistemi per misurare la dispersione:
N
a) Campo di variazione
b) Scostamento semplice medio assoluto dalla media
aritmetica
c) Scarto quadratico medio
31
32
8
19/09/2014
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Richiami Statistica
Misure di dispersione: il campo di variazione.
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Richiami Statistica
Misure di dispersione: scostamento medio assoluto.
Campo di variazione: differenza fra il più grande e il
più piccolo dei numeri.
Cresce con la numerosità dei campioni ⇒ il suo uso è
giustificato solo per campioni di numerosità ridotta e
in assenza di dati anomali.
E’ definito da:
∑
N
j =1
xj − x
N
Nel settore del controllo di qualità è largamente
usato come misura della variabilità del prodotto al
posto della varianza o della deviazione standard.
33
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Richiami Statistica
Misure di dispersione: scarto quadratico medio
E’ definito da:
∑ (x
N
σ=
j =1
j −x
)
34
Richiami Statistica
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Misure di dispersione: varianza.
La varianza di un insieme di dati è definita come il
quadrato dello scarto quadratico medio (σ2).
2
N −1
N-1 al denominatore ⇒ deve essere N>1 per poter
valutare la dispersione.
35
La varianza di una popolazione è solitamente
indicata con σ2; la varianza di un insieme di dati
tratto dalla popolazione (varianza campionaria) è
spesso indicata come s2.
36
9
19/09/2014
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Richiami Statistica
Proprietà dello scarto quadratico medio
Proprietà dello scarto quadratico medio
1. Lo scarto quadratico medio può essere definito
nella forma:
∑ (x
N
σ=
j =1
− a)
2
j
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Richiami Statistica
1. Di tutti gli scarti quadratici medi, il più piccolo è
quello per cui a=media aritmetica; per questa
ragione lo scarto quadratico medio viene
solitamente definito come prima.
N −1
∑ (x
N
a: media qualunque
(non necessariamente la media aritmetica).
σ=
j =1
− a)
2
j
N −1
37
Richiami Statistica
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Proprietà dello scarto quadratico medio
2. Se x ha una distribuzione normale con media µ e
varianza σ2, si può dimostrare che:
a) il 68.27% dei casi è compreso fra -σ e +σ
b) il 95.45% dei casi è compreso fra -2σ e +2σ
c) il 99.73% dei casi è compreso fra -3σ e +3σ
Per distribuzioni moderatamente asimmetriche, si
può ancora ricorrere, con buona approssimazione,
alle precedenti tre percentuali.
39
38
Richiami Statistica
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Teoria elementare della probabilità:
definizione classica
Probabilità che un dato evento si verifichi: rapporto
fra il numero di casi favorevoli e il numero di casi
possibili, purché essi siano tutti ugualmente possibili.
Si tratta chiaramente di una definizione a priori.
40
10
19/09/2014
Richiami Statistica
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Teoria elementare della probabilità:
definizione classica
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Richiami Statistica
Teoria elementare della probabilità
p = prob{E} =
Se:
E=evento
h=numero casi favorevoli
n=numero casi possibili
h
n
La probabilità q che l’evento E non si verifichi
(insuccesso) è data da:

 n−h
q = prob non E  =
= 1 − p = 1 − prob{E}
n


Allora la probabilità p che l’evento E si verifichi
(successo) è data da:
41
Richiami Statistica
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Teoria elementare della probabilità
42
Richiami Statistica
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Definizione di probabilità tramite
la frequenza relativa
0<p<1 sempre
La definizione classica cade in difetto quando i casi
che si possono ritenere ugualmente possibili non
sono numerabili.
Se un evento non può presentarsi la sua
probabilità è 0.
Si ricorre allora alla definizione di probabilità
stimata, che è una definizione “a posteriori”.
Se l’evento è certo la sua probabilità è 1.
43
44
11
19/09/2014
Richiami Statistica
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Definizione di probabilità tramite
la frequenza relativa
Richiami Statistica
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Definizione di probabilità tramite
la frequenza relativa
Probabilità stimata, o empirica: è data dalla
frequenza relativa del presentarsi dell’evento
quando il numero delle osservazioni è molto
grande.
Esempio: Se su 1000 lanci della moneta si ottiene
“testa” 529 volte, la frequenza relativa della opzione
“testa” è 529/1000=0.529; se in altri 1000 lanci esce
“testa” 493 volte, la frequenza relativa sul totale dei
2000 lanci è (529+493)/2000=0.511.
La probabilità è il limite della frequenza relativa
quando il numero delle osservazioni cresce
indefinitamente.
Continuando così ci si avvicina sempre più al numero
definito come probabilità in senso statistico.
45
Richiami Statistica
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
46
Richiami Statistica
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Probabilità condizionata
Probabilità condizionata
E1, E2 eventi
Se il presentarsi o il non presentarsi di E1 non influisce
sulla probabilità di presentarsi di E2, allora
PrE2/E1 o PrE2 dato E1 : probabilità che,
presentatosi E1 si presenti E2
PrE2/E1= PrE2
PrE2/E1 o PrE2 dato E1: probabilità condizionata
di E2, posto che E1 si sia presentato
e si dice che E1 ed E2 sono eventi indipendenti; in caso
contrario, si parla di eventi dipendenti.
47
48
12
19/09/2014
Richiami Statistica
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Probabilità condizionata
Richiami Statistica
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Probabilità condizionata
Se si indica con E1E2 l’evento che si presentino sia E1 sia
E2, detto talvolta evento composto, si ha allora che
Se gli eventi E1 ed E2 sono indipendenti allora:
Pr{E1 E2 } = Pr{E1 }Pr{E2 }
Pr{E1 E2 } = Pr{E1 }Pr{E2 / E1 }
49
Richiami Statistica
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Probabilità che almeno un evento di verifichi
50
Richiami Statistica
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Probabilità che almeno un evento di verifichi
Si dice che due o più eventi si escludono a vicenda se il
presentarsi di uno di essi esclude il presentarsi degli
altri.
Se E1 ed E2 sono eventi che si escludono a vicenda,
Pr(E1E2)=0.
Se E1+E2 indica l’evento che dei due eventi E1 ed E2 “si
presentino o l’uno, o l’altro o entrambi”, allora
51
Pr{E1 + E2 } = Pr{E1 }+ Pr{E2 }− Pr{E1 E2 }
Se gli eventi si escludono a vicenda:
Pr{E1 + E2 } = Pr{E1}+ Pr{E2 }
52
13
19/09/2014
Richiami Statistica
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Richiami Statistica
Teoria elementare della probabilità
Probabilità che almeno un evento di verifichi
Esempio: estrazione di un asso e di una carta di cuori:
4/52+12/52, cui devo sottrarre la probabilità di estrarre
un asso di cuori, per evitare di mettere in conto due
volte la stessa cosa…. Ecco il perché del segno meno ……
Se una variabile X può assumere un insieme discreto
di valori X1, X2, ... , XK con probabilità p1, p2, ... , pK,
(con p1+p2+...+pK=1), ⇒ è stata definita per X una
distribuzione di probabilità discreta.
Funzione di probabilità di X: funzione p(X) che
assume i valori p1, p2, ... , pK rispettivamente in
corrispondenza di X1, X2, ... , XK.
X è una variabile casuale (o stocastica) discreta.
53
Richiami Statistica
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
54
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Richiami Statistica
Distribuzione binomiale
Teoria elementare della probabilità
Quanto detto vale anche se X è continua; in tal caso
il poligono delle frequenze relative diventa, al limite,
una curva continua p(X)=f(X).
Distribuzione continua di probabilità = distribuzione
di densità di probabilità; essa è tale che f(x)dx
fornisce la probabilità che la variabile casuale sia
compresa fra x e x+dx. (il termine “densità” è
riservato alle distribuzioni continue).
55
p: probabilità del successo
q=1-p: probabilità di insuccesso
Probabilità che l’evento si presenti esattamente X
volte in N prove (⇒ la probabilità che si abbiano X
successi ed N-X insuccessi) è data da:
p ( x) =
N!
p X qN−X
X !( N − X )!
56
14
19/09/2014
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Richiami Statistica
Distribuzione binomiale
Richiami Statistica
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Distribuzione binomiale
Esempio: probabilità che si presentino esattamente 2
teste in 6 lanci di una moneta non truccata:
N!
p X qN−X =
X !( N − X )!
6!
5
p( 2) =
0.52 0.56− 2 =
2!(6 − 2)!
24
p( x) =
Distribuzione di probabilità binomiale: è una
distribuzione discreta e presenta le seguenti
proprietà:
Media µ=Np
Varianza σ2=Npq
Scarto quadratico medio σ=√Npq
57
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Richiami Statistica
Y=
1
e
σ 2π
Richiami Statistica
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Distribuzione Normale
Distribuzione normale (di Gauss)
1  ( x − µ )2
− 
2  σ 2
58
L’area delimitata dalla curva e dall’asse delle X
vale 1 (ciò vale per tutte le distribuzioni di
probabilità).




L’area sotto la curva compresa fra le due ordinate
corrispondenti a X=a e X=b, con a<b, rappresenta
la probabilità che X sia compreso fra a e b:
Pa<X<b.
µ: media
σ: scarto quadratico medio.
59
60
15
19/09/2014
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Richiami Statistica
Distribuzione normale
La variabile standardizzata
La variabile standardizzata
adimensionale definita come:
Distribuzione di probabilità normale: è una
distribuzione continua e presenta le seguenti
proprietà:
z=
Media = µ
Varianza = σ2
Scarto quadratico medio = σ
61
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Richiami Statistica
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Richiami Statistica
Distribuzione Normale
è
una
quantità
x−µ
σ
Z misura le deviazioni dalla media rispetto allo scarto
quadratico medio; ciò è molto utile nel confronto fra
distribuzioni.
62
Richiami Statistica
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Distribuzione
Normale
Se la variabile X è espressa in termini di unità
standard, z=(X-µ)/σ, l’equazione data viene
sostituita dalla sua forma standardizzata:
1
1 − 2 z2
Y=
e
2π
In tal caso z è distribuita normalmente con media
zero e varianza uno.
63
64
16
19/09/2014
Richiami Statistica
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Richiami Statistica
Distribuzione Normale
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Distribuzione
Normale
66
65
Richiami Statistica
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Richiami Statistica
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Intervalli di confidenza (intervalli fiduciari)
Distribuzione
Normale
Se X ha distribuzione normale, si può dimostrare che:
il 68.27% dei casi è compreso fra -σ e +σ
il 95.45% dei casi è compreso fra -2σ e +2σ
il 99.73% dei casi è compreso fra -3σ e +3σ
Tali intervalli sono gli intervalli di confidenza e i loro
estremi sono detti limiti di confidenza o limiti fiduciari
al 68.27%, al 95.45%, al 99.73%.
67
68
17
19/09/2014
Richiami Statistica
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Richiami Statistica
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Intervalli di confidenza (intervalli fiduciari)
Intervalli di confidenza (intervalli fiduciari)
Si definisce ”intervallo di fiducia” per il parametro θ,
un intervallo entro il quale il parametro assume i
valori con una prefissata probabilità, chiamata
“livello di fiducia”.
In generale, i limiti di confidenza della media della
popolazione sono dati da:
M m Z cσ
M e σ: media e scarto quadratico medio di una
generica popolazione
70
69
Richiami Statistica
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Intervalli di confidenza (intervalli fiduciari)
ZC :
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Teoria del campione
I concetti sopra esposti derivano dalla Teoria del
campione, che consente di ottenere un risultato
dall’esame di un campione, ricavato dall’universo,
e di valutare la fiducia che esso (e quindi anche i
risultati che se ne ottengono) merita in quanto
rappresentativo dell’universo stesso.
Livello di confidenza o livello di fiducia
Livello di fiducia [%]
68.27
95
95.45
99
99.73
Richiami Statistica
ZC
1
1.96
2
2.58
3
71
72
18
19/09/2014
Richiami Statistica
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Richiami Statistica
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Teoria del campione
Teoria del campione (Teorema del limite centrale)
Qualunque sia la distribuzione della variabile
casuale x dell’universo, purché la media e la
varianza della popolazione siano finiti, la
distribuzione della variabile casuale, cioè la
distribuzione delle medie x di diversi campioni tutti
della stessa numerosità e tratti a caso dall’universo,
è approssimativamente normale.
Quindi, se da una popolazione si traggono tutti i
campioni possibili, costituiti da un numero sufficiente
N (N>50) di dati, le medie dei campioni tendono a
distribuirsi normalmente.
73
Richiami Statistica
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Teoria del campione
σ
x
=
Richiami Statistica
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Teoria del campione
La media di tutte le medie dei singoli campioni è
uguale alla media dell’universo, mentre la varianza
della distribuzione delle medie dei singoli campioni
vale
2
74
σ u2
Se si dovesse operare su molti campioni il
lavoro diventerebbe pesante.
Ma le tecniche statistiche consentono di
ricavare, con una approssimazione definibile a
priori, le caratteristiche dell’universo operando
su un solo campione.
n
Con: σ2u varianza dell’universo
n: numero dati ciascun campione.
75
76
19
19/09/2014
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Richiami Statistica
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Richiami Statistica
Teoria del campione
Teoria del campione
Ciò è possibile per il fatto che ogni singolo campione
riproduce
approssimativamente
le
costanti
statistiche dell’universo (media, varianza, etc.).
Allora grazie alle proprietà della distribuzione
normale, gli intervalli di confidenza per la media
della popolazione sono dati da:
⇒ la probabilità che un valore medio ottenuto da
un singolo campione si avvicini alla media delle
medie di numerosi campioni e quindi alla media
dell’universo, è definita da una curva normale con
media = a quella dell’universo e varianza deducibile
da quella dell’universo.
X m Z Cσ X
X m ZC
77
σu
n
Applicata alla distribuzione
delle medie dei campioni
Applicata alla distribuzione
degli elementi dell’universo
78
Progettazione e Gestione
degli Impianti Industriali
A.A. 2014-2015
Richiami Statistica
Teoria del campione
Quando il valore di σu è incognito, si può utilizzare
al suo posto lo scarto quadratico medio σc del
campione:
σX ≅
σc
Da cui:
n
X c m ZC
σc
n
Applicata al singolo campione come
rappresentativo dell’universo
79
20