Statistica (agg. 06 Nov 2007)

Prof. Ing. Michele Marra - Appunti delle Lezioni di Ricerca Operativa - Concetti generali sulla statistica
CAPITOLO II
2.1 - CONCETTI GENERALI SULLA STATISTICA
La statistica è l'applicazione dei metodi scientifici alla programmazione della raccolta
dei dati, alla loro classificazione, elaborazione, analisi, sintesi e presentazione di
conclusioni attendibili da essi.
Essa può essere del tipo descrittivo (osservazione statistica) o di tipo induttivo
(inferenza statistica).
La statistica descrittiva consente, attraverso l'analisi di un campione di dati, di
estrapolare i risultati all'universo.
La statistica induttiva consente, partendo dallo stesso campione, non solo di effettuare
delle previsioni per l'intero universo ma di definire una misura della validità delle
previsioni fatte.
Infatti col ragionamento induttivo, dall'osservazione di certi casi particolari si traggono
illazioni su tutti i casi della specie in esame, che non sono certe, ma solo probabili, in
quanto sono una estensione dei risultati dell'osservazione.
2.1.1. - Statistica descrittiva
Il risultato di una osservazione su di uno dei fenomeni individuali è detto unità
statistica (il diametro di ogni tondino, ad es.).
Il risultato di una operazione compiuta sopra le unità statistiche è poi detto dato
statistico (il diametro medio dei tondini esaminati, ad es.).
Per procedere ad uno studio statistico è necessario effettuare delle Rilevazioni
campionarie: che sono procedimenti atti a raccogliere ed analizzare pochi dati
(campione) allo scopo di ottenere informazioni su di una quantità grande di elementi
(universo).
Quanti elementi bisogna raccogliere? La risposta precisa la si potrà dare solo quando
verrà trattata la teoria della stima statistica. Si può sin d'ora anticipare però che la
attendibilità della stima sull'universo aumenta in proporzione alla radice quadrata del
numero dei dati osservati costituenti il campione.
Il tipo di campionamento che verrà normalmente utilizzato è il campionamento casuale
semplice, per il quale ogni unità statistica ha la stessa probabilità di venire scelta. In tal
caso perché il campione sia rappresentativo è necessario che l'universo da cui esso viene
prelevato, sia omogeneo, cioè formato da elementi simili e soggetti agli stessi fattori
casuali. L'osservazione statistica si basa sull'analisi di un campione di dati, estrapolando
poi i risultati ottenuti all'intero universo attraverso il calcolo di opportune caratteristiche
(medie, percentuali, numeri indice) e la loro rappresentazione grafica.
Ad esempio supponiamo che una azienda meccanica produca giornalmente una serie di
Politecnico di Bari – Riservato alla circolazione interna
13
Prof. Ing. Michele Marra - Appunti delle Lezioni di Ricerca Operativa - Concetti generali sulla statistica
pezzi di cui si vogliono conoscere le caratteristiche meccaniche.
Se tale conoscenza comporta la distruzione del pezzo, è chiaro che non possiamo
distruggere tutti i pezzi.
Per risolvere il problema prendiamo un limitato campione di pezzi e studiamo le
caratteristiche di questo.
Ora, indipendentemente dalla accuratezza della rilevazione è probabile che da una
semplice osservazione dei dati non riusciamo a comprendere la portata del fenomeno a
meno che non organizziamo i dati a disposizione in maniera che ci aiutino a capire le
leggi che lo regolano.
Operazioni da effettuare sui dati :
1) Organizzarli sotto forma di distribuzione di frequenza ossia contare quante volte
(frequenza assoluta) uno stesso valore è attribuito a dati diversi, e ciò a partire dal
valore più piccolo, fino ad arrivare al valore più grande rilevabile dall'insieme dei
dati.
2) Rappresentare graficamente la distribuzione di frequenza.
L'esperienza infatti ha dimostrato che una tale rappresentazione rende molto più
facilmente comprensibili le caratteristiche fondamentali della distribuzione anche per
confronto con eventi simili già verificatisi in passato.
Le distribuzioni di frequenza possono essere discrete o continue a seconda della natura
della variabile che le misura...
In ogni caso conviene normalizzare le distribuzioni di frequenza per svincolarle dal
numero dei dati a disposizione. Per fare ciò basta considerare le frequenze relative
intese come rapporto fra le frequenze assolute ed il numero delle misurazioni effettuate.
In tal modo la somma di tutte le frequenze relative assume il valore 1 e diventa inoltre
più facile il confronto con le distribuzioni teoriche note.
Ottenuta la nostra distribuzione di frequenza il problema si riduce ad un semplice
confronto della nostra curva con curve standard ottenute in precedenza.
2.2. - Rappresentazione qrafìca di una distribuzione di frequenza
Supponiamo di avere delle grandezze continue e sia n la numerosità del campione
considerato. La prima cosa da fare è organizzare questi dati in una forma opportuna, cioè
ordinarli in una forma crescente individuando un valore Xmin e un valore Xmax e
dividendo questo intervallo in un certo numero di parti in modo da poter vedere in
questi singoli intervalli quanti dati cadono.
Questo vuol dire individuare un certo numero di classi in modo tale che, noto il numero
di dati entro ciascuna di queste, sia possibile fare una rappresentazione grafica della
distribuzione di frequenza corrispondente.
Questa rappresentazione consiste nel costruirsi un rettangolo che abbia come base un
segmento proporzionale all'ampiezza della classe e come altezza un segmento
proporzionale al rapporto tra la frequenza relativa e l'ampiezza della classe (fig. 1)
Politecnico di Bari – Riservato alla circolazione interna
14
Prof. Ing. Michele Marra - Appunti delle Lezioni di Ricerca Operativa - Concetti generali sulla statistica
b
h
frequenza relativa
x
x
min
max
h=
b
Fig. 2.1 - Rappresentazione grafica della distribuzione di frequenza
b=
X max − X min
n
Il problema che si presenta per primo è quindi quello di stabilire quante classi prendere,
perchè il numero di dati è limitato. Se noi prendessimo un numero piccolo di classi,
avremmo un piccolo numero di rettangoli che sarebbero poco significativi; viceversa
prendendo un numero elevato di classi, potremmo avere tanti rettangolini, alcuni dei
quali però, potrebbero essere vuoti e altri stracolmi di dati e quindi anche in questo caso
avremmo una rappresentazione poco significativa. Dobbiamo quindi trovare un
opportuno numero di classi in cui suddividere il nostro intervallo (Xmin, Xmax ).
Purtroppo non esiste una regola generale che indichi come ripartire il nostro intervallo.
L'esperienza ha dimostrato che il numero delle classi in cui suddividere il nostro
intervallo si può assumere pari a:
numero di classi = n
(2.1)
dove n è il numero di dati del campione in esame.
L'ampiezza delle classi, che indichiamo con A, è data da:
A=
X max − X min
n
Il numero delle classi che viene fuori dalla (2.1) deve essere, ovviamente, intero per cui
andremo ad arrotondarlo opportunamente, per difetto o per eccesso all'intero più
prossimo.
Una volta individuate le classi, occorre considerare quei dati che si trovano sul confine
di ciascun intervallo e stabilire se attribuirli alla classe che li precede o che li segue. Al
numero di classi trovato con la (2.1) dobbiamo aggiungere quella classe che contiene un
solo elemento, cioè l'estremo inferiore o l'estremo superiore dell'intervallo (Xmin o Xmax )
a seconda che abbiamo scelto di attribuire gli elementi sul confine alla classe
precedente o a quella successiva, rispettivamente.
Diviso il nostro campione in queste classi, andiamo a distribuire all'interno di queste i
dati rilevati. In definitiva quello che otteniamo è un istogramma, cioè un insieme di
rettangoli che hanno le seguenti caratteristiche:
a) la base di ogni rettangolo è pari all'ampiezza A della classe;
b) l'altezza è tale che l'area del rettangolo sia proporzionale alla frequenza relativa di
quella classe, in altre parole è proporzionale al rapporto tra il numero di dati che
cadono in quella classe e il numero totale dei dati n.
Se facciamo tendere n all'infinito il numero delle classi aumenta e l'istogramma tende
ad una distribuzione continua.
In tal caso, se consideriamo un certo valore x che la variabile può assumere, il valore
della corrispondente ordinata moltiplicata per un intervallo infinitesimo dx, darà la
probabilità che il nostro dato ha di assumere quel particolare valore
ydx = f(x)dx = p(x)dx
Politecnico di Bari – Riservato alla circolazione interna
15
Prof. Ing. Michele Marra - Appunti delle Lezioni di Ricerca Operativa - Concetti generali sulla statistica
Conseguentemente la probabilità che la nostra variabile ha di assumere un valore tra x1
e x2 sarà data da:
∫
x2
x1
p( x)dx
100
80
60
40
20
0
a) Caso di distribuzione di una variabile continua
Esempio di istogramma
Il discorso non cambia se la variabile è discreta; in questo caso ci riferiremo ad una
curva discreta. Quindi se abbiamo un campione con n dati, invece di considerare gli
intervalli compresi tra Xmin e Xmax, dobbiamo vedere qual'è la frequenza che spetta ad
ogni valore discreto compreso tra Xmin e Xmax e trasformare questa frequenza da assoluta
a relativa, ottenendo una serie di segmenti verticali relativi ad ogni valore che la
variabile assume.
b) Caso di distribuzione di variabile discreta
2.3. - Caratteristiche fondamentali di una distribuzione di frequenza
Considerando un campione e organizzando i dati secondo una certa distribuzione di
frequenza, si definiscono, per la variabile in questione, due parametri fondamentali:
1) tendenza centrale
2) dispersione
Politecnico di Bari – Riservato alla circolazione interna
16
Prof. Ing. Michele Marra - Appunti delle Lezioni di Ricerca Operativa - Concetti generali sulla statistica
La tendenza centrale ci dice quale può essere il valore più probabile di una
osservazione.
La dispersione invece ci indica se i dati del campione sono raccolti in un campo ristretto
o largo.
2.3.1. - Tendenza centrale
Esistono diversi parametri atti a misurare la tendenza centrale; i principali sono:
a) la moda: è il valore che la variabile assume più frequentemente;
b) la mediana: è il valore centrale della serie dei valori osservati ordinati in modo
crescente.
Se i nostri dati sono n, con n dispari, si sceglie come misura della tendenza centrale il
valor che occupa il posto centrale.
Ad esempio se ho 101 dati, la misura della tendenza centrale è data dal valore del 51
dato.
Se i dati sono n, con n pari, poiché non ho un dato che si trova esattamente a metà
dell'intervallo, allora come valore della mediana prendo la media aritmetica tra i due
dati che si trovano in posizione centrale, cioè devo considerare la media aritmetica tra i
dati di posto (n/2 + 1) e (n/2 - 1).
Questo metodo non è molto usato.
c) la media aritmetica di tutti i valori che la nostra variabile assume (questo è il metodo
più usato), cioè:
xi
x = ∑n1
n
(2.2)
2.3.2. – Dispersione
Anche in questo caso esistono diversi metodi per valutare la dispersione. Esaminiamone
alcuni:
a)
media degli scarti: questo metodo consiste nel prendere in considerazione gli
scarti dal valor medio e farne la media. Però siccome gli scarti possono assumere sia
valori positivi che negativi, all'aumentare delle osservazioni, cioè per n che tende
all'infinito, questa somma tende a zero.
∑
lim
n
i =1
( xi − x)
=0
n
Per questo motivo si preferisce ricorrere alla media dei quadrati degli scarti. In questo
modo siamo sicuri che tutte le grandezze sono positive e la loro somma non tenderà più
a zero.
La grandezza che si ottiene è detta varianza e si indica con
n
∑i=1 ( xi − x )2
2
σ =
(2.3)
n
La teoria statistica ha dimostrato però che la migliore misura per la varianza si ottiene
ponendo al denominatore della (2.3) (n-1) al posto di n. La varianza così ottenuta è detta
varianza corretta:
n →∞
Politecnico di Bari – Riservato alla circolazione interna
17
Prof. Ing. Michele Marra - Appunti delle Lezioni di Ricerca Operativa - Concetti generali sulla statistica
( x − x )2
∑
i =1 i
σ = n−1
2
n
(2.4)
Come valore della dispersione si usa quindi σ che è detta scarto quadratico medio.
σ=
∑i =1 ( xi − x )2
n
(2.5)
n −1
b) un altro metodo è quello di considerare l'intervallo d'esistenza e prendere come
misura della dispersione la differenza tra i valori degli estremi Xmin e X max (range).
Questo però è un metodo grossolano, che è tuttavia usato in campo aziendale come
verifica alle tolleranze di lavorazione (controllo di qualità).
2.4. - Variabile casuale discreta
Una variabile casuale discreta è una quantità variabile che può assumere un nr. finito
di valori reali (determinazioni) xl, x2,..., xn con probabilità, rispettivamente, p1 = f(x1),
p2= f(x2), ...., pn=f(xn) tali che la loro somma è uguale ad 1.
Ad esempio il punto che compare quando si lancia un dado è una variabile casuale che
può assumere i valori: 1, 2, 3, ...,6 ciascuno con probabilità 1/6.
I valori x1, x2, ..., xn che compaiono nella definizione di variabile casuale possono
anche, in parte, coincidere.
Basta riunire insieme e considerare come unico evento tutti i casi in cui x assume uno
stesso valore, qualunque esso sia; a valori distinti corrisponderanno allora eventi
distinti, incompatibili fra loro.
Prendiamo in esame la variabile casuale, rappresentata dal "nr. di volte che appare testa"
lanciando 4 volte una moneta; la faccia testa può verificarsi:
X0=0 volte
X1=1 volta
X2=2 volte
CCCT
⎧CCCT
⎪CCTC
⎪
⎨
⎪CTCC
⎪⎩TCCC
⎧CCTT
⎪CTCT
⎪
⎪⎪CTTC
⎨
⎪TCTC
⎪TTCC
⎪
⎩⎪TCCT
p0=
1
24
p1=
4
24
p2=
6
24
Politecnico di Bari – Riservato alla circolazione interna
18
Prof. Ing. Michele Marra - Appunti delle Lezioni di Ricerca Operativa - Concetti generali sulla statistica
X3=3 volte
⎧CTTT
⎪TCTT
⎪
⎨
⎪TTCT
⎪⎩TTTC
p3=
X4=4 volte
{TTTT
p4=
e deve verificarsi che
∑
4
24
1
24
pi =1.
1
1
1
1 1 16
+4 4 +6 4 +4 4 + 4 =
=1
4
2
2
2
2 2 16
Esaminiamo ora le più note distribuzioni di frequenza.
∑p
i
=
2.5. - Distribuzione binomiale o di Bernoulli
Abbiamo visto che la probabilità di ottenere esattamente k successi in n prove ripetute
viene fornita dall'espressione di Bernoulli
⎛n⎞
⎛n⎞
Pk = ⎜⎜ ⎟⎟ p k (1 − p) n − k = ⎜⎜ ⎟⎟ p k q n − k
⎝k ⎠
⎝k ⎠
(2.6)
Se consideriamo n e p costanti, allora la suddetta funzione Pk è una distribuzione di
probabilità
k 0
Pn qn
1
⎛ n ⎞ n−1
⎜⎜ ⎟⎟q p
⎝1⎠
2
⎛ n ⎞ n −2 2
⎜⎜ ⎟⎟q p
⎝ 2⎠
…
…
n
pn
Essa è detta distribuzione binomiale poiché per k=1, 2, ..., n essa corrisponde ai termini
successivi dello sviluppo del binomio
⎛n⎞
⎛n⎞
(q + p) n = q n + ⎜⎜ ⎟⎟q n −1p + ⎜⎜ ⎟⎟q n − 2 p 2 + ... + p n
⎝1⎠
⎝ 2⎠
Viene anche detta distribuzione di Bernoulli.
La distribuzione binomiale si considera ogni volta che ci troviamo di fronte a
popolazioni nelle quali ci sono degli individui che presentano caratteristiche ben
definite.
Un esempio lampante è quello di lotti di produzione che presentano sempre un definito
numero di pezzi difettosi.
Facciamo subito un esempio.
Supponiamo di fare un'indagine su una produzione di pezzi; supponiamo di accorgerci
che il 20% di questi pezzi sono difettosi. Facciamo dei controlli periodici prendendo a
caso dei campioni di 10 pezzi. Naturalmente è improbabile trovare su un campione di
10 pezzi due pezzi difettosi; però prendendo un numero molto grande di campioni da 10
pezzi sarà probabile trovare 2 pezzi difettosi come valor medio dei campioni
Politecnico di Bari – Riservato alla circolazione interna
19
Prof. Ing. Michele Marra - Appunti delle Lezioni di Ricerca Operativa - Concetti generali sulla statistica
considerati. Per il teorema di Bernoulli la probabilità che ha un campione di numerosità
n estratto da un lotto infinito con una proporzione di difettosi p, di contenere k articoli
difettosi, è data da:
⎛n⎞
Pk = ⎜⎜ ⎟⎟p k (1 − p) n − k
⎝k⎠
dove n = numerosità del lotto;
p = probabilità di difetto del lotto;
Se noi teniamo fissi n e p e facciamo variare k tra 0 ed n, possiamo calcolarci le
corrispondenti probabilità. La distribuzione binomiale dipende quindi da due parametri,
la numerosità del campione n, la probabilità di difetto p; essa è quindi biparametrica.
Esempio 2.1:
Sia n=10 la numerosità del lotto;
p=1/5 la probabilità di difetto del lotto;
k=0, 1, 2,…,10 gli articoli difettosi.
Costruiamo la seguente tabella:
k art.
difett.
0
1
2
3
4
5
6
7
8
9
10
Totale
prob.binom.
freq.dei camp. freq.
secondo Bernoulli con k difettosi relativa
0,1074
5
0,10
0,2684
14
0,28
0,3020
15
0,30
0,2013
10
0,20
0,0881
4
0,08
0,0264
1
0,02
0,0055
1
0,02
0,0008
0
0,00
0,0001
0
0,00
0,0000
0
0,00
0,0000
0
0,00
1,0000
N=50
1,00
Supponiamo di estrarre dal nostro universo una serie di campioni di 10 articoli ciascuno
e andiamo a contare quante volte questi campioni hanno presentato un numero di
articoli difettosi; supponiamo che questi siano N=50 campioni (III col.). Determiniamo
la frequenza relativa con cui questi campioni hanno assunto quei valori difettosi (IV
col.). Avendo preso n=10 e p=1/5, possiamo costruirci la curva binomiale teorica (II
colonna).
Dopo aver diagrammato le due curve, quella ottenuta con la formula di Bernoulli e
quella sperimentale, se vediamo che queste si discostano notevolmente, significa che c'è
qualcosa che non va nel nostro processo produttivo.
Politecnico di Bari – Riservato alla circolazione interna
20
Prof. Ing. Michele Marra - Appunti delle Lezioni di Ricerca Operativa - Concetti generali sulla statistica
↑
Fig.2.4 - Confronto tra le frequenze teoriche e quelle effettive del verificarsi di campioni con x
articoli difettosi (per x = 0, 1, 2, …, 10)
Si può dimostrare che questa distribuzione ha media = n p e scarto quadratico medio
σ = n⋅ p q
2.5.1. - Esempi di applicazione della distribuzione binomiale
Esempio 2.5.1.1 - Si prenda in esame un lotto che contiene il 10% di pezzi difettosi e
quindi i1 90 % di pezzi buoni.
L'universo sarà allora caratterizzato da p = 0,90 e q = 0,10; la probabilità di estrarre
esattamente 2 pezzi difettosi su 10 estratti, cioè di estrarre 8 pezzi buoni su 10 è:
⎛10 ⎞
P(8) = ⎜⎜ ⎟⎟ 0,98 0,10 2 = 45 × 0,430 × 46 × 721× 0,01 = 0,1937
⎝8⎠
In media su 10 estrazioni si hanno:
μ = 10 x 0.9 = 9 pezzi buoni
con uno scarto quadratico medio di
σ = 10 × 0,9 × 0,10 = 0,9 = 0,94
Esempio2.5.1.2 - In una città di 5000 adulti a 100 di essi viene richiesta la loro
opinione su di un progetto municipale: 60 risultano favorevoli e 40 contrari. Se in
effetti gli adulti della città fossero in egual numero favorevoli e contrari, quale sarebbe
la probabilità di ottenere il 60% o più di favorevoli in un campione di 100.
Risposta:
Siamo nel caso di X successi in n prove a probabilità costante. La distribuzione di
probabilità di avere x favorevoli in 100 esaminati è data da:
⎛100 ⎞ x (100− x )
⎟⎟p q
a) P( x ) = ⎜⎜
⎝ x ⎠
Politecnico di Bari – Riservato alla circolazione interna
21
Prof. Ing. Michele Marra - Appunti delle Lezioni di Ricerca Operativa - Concetti generali sulla statistica
b) Ma il testo dice numero favorevoli p = numero contrari q:
p = q = 0,5
e tenendo presente che
p x q (100− x ) = p100 = 0,5100
100 100
⎞ 100
⎛
⎟⎟0,5
P( x ≥ 60) = ∑ ⎜⎜
x = 60⎝ x ⎠
Esempio 2.5.1.3 - Uno studente deve sostenere un esame che consiste nel dare una
risposta (scelta tra cinque, di cui una sola è giusta) ad 8 domande. Posto che l'esame è
superato quando si da la risposta ad almeno 3 domande, si vuole conoscere quale è la
probabilità che uno studente impreparato superi l'esame.
Possiamo vedere le 8 domande come una serie di 8 prove indipendenti con probabilità
di avere SUCCESSO (risposta esatta 1/5 = 0,2).
La probabilità da noi cercata è P(x > 3) quindi avremo:
8!
(0,2)3 (0,8)5 = 0,1468
P ( x = 3) =
3!(8 − 3)!
8!
(0,2) 4 (0,8) 4 = 70 × 0,0016 × 0,4096 = 0,0459
P ( x = 4) =
4!(8 − 4)!
8!
P ( x = 5) =
(0,2)5 (0,8)3 = 0,092
5!(8 − 5)!
8!
(0,2) 6 (0,8) 2 = 0,0011
P ( x = 6) =
6!(8 − 6)!
8!
P ( x = 7) =
(0,2)7 (0,8)1 = 0,0001
7!(8 − 7)!
P ( x = 8) = trascurabile
Probabilità da noi cercata = 0,1468+
0,0459+
0,092 +
0,0011+
0,0001+
0,2859+
Lo stesso risultato si può ottenere anche e forse più semplicemente come:
P(x≥3) = 1 – P(x=0) – P(x=1) – P(x=2)
Esempio 2.5.1.4 - Un tiratore scelto colpisce in media 1 volta su 10 il bersaglio.
Determinare la probabilità che su 20 tiri colpisca almeno 2 volte il bersaglio.
E' un problema di prove ripetute che si può risolvere con la distribuzione binomiale e
cioè posto:
p = 1/10 ed n = 20
Politecnico di Bari – Riservato alla circolazione interna
22
Prof. Ing. Michele Marra - Appunti delle Lezioni di Ricerca Operativa - Concetti generali sulla statistica
20
si vuole conoscere P(x > 2) per cui avremo, evitando di fare la
∑
n =2
20
19
⎛ 20 ⎞ ⎛ 1 ⎞ ⎛ 9 ⎞
⎛9⎞
P(x > 2) = 1 - P(x = 0) - P(x = 1) = 1 − ⎜ ⎟ − ⎜⎜ ⎟⎟ ⎜⎜ ⎟⎟ ⎜ ⎟ = 0,608
⎝ 10 ⎠
⎝ 1 ⎠ ⎝10 ⎠ ⎝ 10 ⎠
2.6. - Distribuzione di Poisson
Supponiamo che il numero di prove n tenda all'infinito, mentre p tenda a zero; sia
il prodotto m = p*n una quantità finita con
m = numero medio di successi atteso in n prove indipendenti;
la nuova distribuzione di frequenza così ottenuta è detta distribuzione di Poisson.
In questo caso la probabilità di contenere k difettosi è:
e − mmk
Pk =
k!
La differenza tra la formula di Bernoulli e di Poisson è che la prima ci pone di fronte
a due parametri (n,p), la seconda di fronte al solo parametro m.
Vediamo se è vero che con la formula di Poisson possiamo costruirci una
distribuzione di frequenza.
Affinché ciò sia vero occorre che la somma dei valori Pk, con k=0, 1, ...., n, sia
uguale ad uno, ovvero la probabilità totale deve essere uguale ad uno. Infatti:
e − m m0
0!
p0 + p1 + p2 +......+ pn =
=e
−m 1
+ e 1!m + e
0
−m m
0!
(
1
−m
m2
2!
+.......+ e
−m
mn
n!
=
2
+ m1! + m2 ! +.....) = e − m * e m = 1
dove
e=
0
0!
+ 11! +
2
2!
+....
m0
em = 0 !
1
2
+ m1! + m2 ! +......
quindi questo tipo di distribuzione è normalizzata e può essere presa come
distribuzione classica.
Vediamo come, praticamente, si può sfruttare la relazione di Poisson. Supponiamo
che il nostro processo produttivo sia talmente sofisticato che i pezzi difettosi siano
trascurabili.
Osserviamo per esempio per 201 giorni i pezzi prodotti e verifichiamo se in
effetti i pezzi difettosi siano trascurabili. Riportiamo le informazioni ricevute in tabella.
Politecnico di Bari – Riservato alla circolazione interna
23
Prof. Ing. Michele Marra - Appunti delle Lezioni di Ricerca Operativa - Concetti generali sulla statistica
num.art.difett.
prodotti in 1
giorno
num.gior. in cui si
sono manifestati k
art.difettosi
0
1
2
3
4
5
6
7
totale
102
59
31
8
0
1
0
0
201
freq. relat.
sperimentale
0,5075
0,2935
0,1542
0,0398
0,0000
0,0050
0,0000
0,0000
1,0000
freq. relat.
sec.Poisson
0,4741
0,3538
0,1320
0,0328
0,0061
0,0009
0,0000
0,0000
0,9997
La formula di Poisson è:
−m
k
Pk = e km!
In questa relazione non conosciamo m, cioè il numero di pezzi difettosi trovati in
201 giorni. Questo valore tuttavia può essere calcolato con la media pesata, ovvero:
m=
0 ∗ 102 + 1 ∗ 59 + 2 ∗ 31 + 3 ∗ 8 + 4 ∗ 0 + 5 ∗ 1 + 6 ∗ 0 + 7 ∗ 0
= 0,7463
201
ovvero
m = 0,7463.
Per calcolare m non abbiamo usato né n né p.
Applichiamo ora la formula di Poisson per calcolare Pk in corrispondenza di m
con k variabile tra 0, ...., 7.
Raccogliendo questi valori nella colonna IV, vediamo che la probabilità è pari a
0,9997. Poiché la corrispondenza fra le frequenze relative osservate e quelle calcolate è
ragionevolmente stretta, concludiamo che i dati rilevati sono il risultato di condizioni
che portano ad una distribuzione di Poisson, cioè gli articoli difettosi si presentano per
caso e tanto raramente che il processo di produzione deve essere considerato sotto
controllo e non v’è ragione di sospettare errori. D’altra parte, se le frequenze osservate
non avessero avuto una ragionevole corrispondenza con le frequenze teoriche, ciò
avrebbe indicato che i difetti non si verificavano casualmente, senza un preciso motivo,
ma che invece derivavano da una qualche imperfezione esistente nella fase produttiva.
2.6.1. Esercizio di confronto tra binomiale e poissoniana.
Si confrontino le esatte probabilità (con la distribuzione binomiale) e le probabilità
approssimate (con la distribuzione di Poisson) di estrarre x = 0, 1, 2,.... pezzi buoni in
64 estrazioni indipendenti, da un lotto in cui i pezzi buoni sono 1/32 (cioè p = 1/32).
La binomiale dà:
x
64 − x
⎛ 64 ⎞ ⎛ 1 ⎞ ⎛ 31 ⎞
con (x=0, 1, 2, ..., 64)
Pb ( x) = ⎜⎜ ⎟⎟ ⎜ ⎟ ⎜ ⎟
⎝ x ⎠ ⎝ 32 ⎠ ⎝ 32 ⎠
Politecnico di Bari – Riservato alla circolazione interna
24
Prof. Ing. Michele Marra - Appunti delle Lezioni di Ricerca Operativa - Concetti generali sulla statistica
La distribuzione di Poisson dà (essendo m = np = 64 *
p(x) =
e -2 2 x
x!
1
32
= 2)
con (x=0, 1, 2, ...., 64)
Si ottiene:
x
0
1
2
3
4
5
6
7
8
9
Probab. esatte
p(x)
0.131
0.271
0.275
0.183
0.090
0.035
0.011
0.003
0.001
0.000
Probab. approssimate
g(x)
0.135
0.271
0.271
0.180
0.090
0.036
0.012
0.004
0.001
0.000
Per m=np abbastanza grande (in pratica per m>9) la distribuzione di Poisson
può essere approssimata da una distribuzione normale con media m e s.q.m. uguale
a npq .
Esempio 2.6.1 - Calcolare la probabilità che ci siano non più di 5 pezzi difettosi in
un cassetto che contiene 200 pezzi, sapendo che in media il 2% dei pezzi è difettoso.
Possiamo vedere che il termine m= 200*(0.02) = 4 pezzi difettosi, quindi applicando
la distribuzione di Poisson avremo:
5
e −4 4 x
g ( x ≤ 5) = ∑
=
x!
x =0
⎛
42 43 44 45 ⎞
⎟ = 0,785
= e − 4 ⎜⎜1 + 4 +
+
+
+
2
6 24 120 ⎟⎠
⎝
2.7. - Variabile casuale continua
Quando la variabile casuale x può assumere qualsiasi valore reale in un certo
intervallo a----b, è detta continua e la distribuzione di probabilità ad essa
associata è detta distribuzione continua di probabilità; f(x) è definita
nell'intervallo a----b dove assume valori non negativi, e può rappresentarsi con una
curva continua tale che l'area compresa sotto la curva è uguale all'unità
∫
b
a
f ( x )dx = 1
Nella misurazione dello spessore di lamierini metallici, ad esempio, supponiamo di
estendere la misura ad un numero infinito di lamierini e di aumentare sempre di più
Politecnico di Bari – Riservato alla circolazione interna
25
Prof. Ing. Michele Marra - Appunti delle Lezioni di Ricerca Operativa - Concetti generali sulla statistica
la precisione della misurazione dello spessore. Siamo così in grado di ridurre
progressivamente l'intervallo della classe. Poiché lo spessore è una variabile continua,
se continuiamo a misurare indefinitamente, nessuna delle nostre classi, per quanto
piccolo sia il suo intervallo sarà vuota. Al contrario la frequenza
assoluta
di
ciascun
intervallo
aumenterà indefinitamente. Se allora Δ fi è la frequenza
della
cella
relativa della variabile nell'intervallo xi±1/2 Δ xi l'altezza
dell'istogramma sarà data da y =
Δfi
Δx i
.
Al limite avremo una curva continua della frequenza relativa y=f(x) tale che la
frequenza relativa con cui la variabile giace dentro un intervallo xi ± 1/2 dx sarà data
da ydx =f(x)dx, tenendo presente la definizione di probabilità statistica, f(x)dx altro
1
non è che la probabilità dp(x) che x cada nell'intervallo x± 2 dx. Pertanto al limite
l'istogramma di una variabile continua si trasforma nella curva di probabilità della
variabile. Ne consegue che la probabilità che x cada in un intervallo a ≤ x ≤ b è data
da:
P(a≤x ≤b) =
∫
b
a
f(x)dx
Definendo f(x)=0 nei punti fuori dal campo di definizione della variabile x, si ha:
∫
f(x) dx =1
Come risulta intuitivamente dal fatto che x deve senz'altro cadere nel proprio
intervallo di definizione. Nel caso di una variabile continua x non ha senso parlare
di probabilità di un valore xi, ma si può parlare soltanto di probabilità che x cada
nell'intervallo xi ±1/2 dxi.
In questo modo noi abbiamo dp(x)=f(x)dx dove f(x)dx viene comunemente chiamata
densità di probabilità mentre la curva y=f(x) si dice curva di probabilità.
2.8. - Valor medio di una variabile casuale
Se una variabile casuale X è suscettibile di una definizione concreta, i valori x1 , x2 ,
...., xn di essa dovranno potersi ottenere mediante effettive esperienze, osservazioni
o misure ed a ciascuno di questi valori corrisponderà una determinata frequenza che
al crescere del numero delle prove si accosterà generalmente alle rispettive
probabilità.
Poniamo che in n prove i valori x1 ,x2 ,...., xn di X si presentino ν1, ν2,....νn volte,
(ν1+ν2+....+νn)= n. Allora la media aritmetica dei valori assunti da x nelle n prove è
1
(v1x1 + v2 x2 + ... + vn xn ) = v1 x1 + v2 x2 + ... + vn xn
n
n
n
n
(2.8.1)
Una previsione teorica di questo valore medio empirico di X si può fare con sufficiente
approssimazione (se n è abbastanza alto) quando si conoscono le probabilità p1 , p2 ,
..., pn , di questi n valori.
νi
Basta sostituire la p alle n nella (0). Si arriva così alla nozione di valore medio
teorico o valore medio di X
Politecnico di Bari – Riservato alla circolazione interna
26
Prof. Ing. Michele Marra - Appunti delle Lezioni di Ricerca Operativa - Concetti generali sulla statistica
M(X) = p1 x1 + p2 x2 +.....+ pn xn
Il valor medio di una variabile casuale è la somma dei prodotti dei valori che essa
può assumere moltiplicati per le rispettive probabilità.
2.9. - Distribuzione di Gauss
Quando le grandezze in gioco sono reali, la relazione di Bernoulli, (valida per
grandezze intere) si trasforma in una distribuzione continua, cioè quella di Gauss.
Essa rappresenta particolarmente bene le variazioni di una grandezza sottoposta
all’influenza simultanea di un insieme di cause tutte di piccola entità tra le quali nessuna
prevale decisamente e che nel tempo si mantengono sufficientemente stabili (casualità).
Questa distribuzione continua è esprimibile secondo la relazione:
−
1
P( x) =
∗e
2π σ
( x − x)2
2σ 2
(2.9.1)
Il valore di P(x) è una misura che rappresenta l'ordinata e cioè l'altezza della curva di
Gauss in corrispondenza del particolare valore x.
Se invece di considerare x consideriamo un intervallino dx elementare, l'area P(x)dx
rappresenta la probabilità che ha la nostra variabile di assumere il valore x. Se
volessimo la probabilità che ha la nostra variabile di assumere un valore
compreso tra x1 e x2 , cioè in un intervallo finito, essa è data da:
x2
x2
−
1
P ( x1 ≤ x ≤ x2 ) = ∫ p ( x) dx = ∫
e
x1 σ 2π
x1
( x − x)2
2σ 2
dx
Una distribuzione di questo tipo è difficile da utilizzare perchè dipende da due
parametri, cioè x e σ.
Se avessimo n valori rappresentanti un certo campione, dovremmo calcolare i valori
max e min, individuare il numero di classi, calcolare la frequenza relativa e
costruirci il corrispondente istogramma.
Se volessimo costruirci sullo stesso diagramma cartesiano la curva di Gauss,
Politecnico di Bari – Riservato alla circolazione interna
27
Prof. Ing. Michele Marra - Appunti delle Lezioni di Ricerca Operativa - Concetti generali sulla statistica
dovremmo calcolare il valore medio
x relativo ai nostri dati, poi calcolare la
varianza, quindi assegnando ad x i valori compresi tra xmin e xmax potremmo
costruire la curva di Gauss relativa a questi due parametri x e σ.
La curva di Gauss ha due punti di flesso in corrispondenza di x -σ e x +σ, inoltre è
asintotica verso + ∞ e - ∞ .
In pratica noi consideriamo solo quella parte compresa tra i valori di x -4 σ e
x +4σ, perchè tra questi due valori l'area è pari al 99,994% dell'area totale.
In pratica la dispersione di questa distribuzione di frequenza è esprimibile in
funzione dello scarto quadratico medio σ. La curva costruita in questa maniera è
relativa ai particolari valori di x e σ, di questa curva possiamo avere bisogno di
calcolare l'area all'interno di un dato intervallo (x1 ,x2 ); questo equivale a risolvere la
4), oppure bisogna ricorrere a tabelle, ma questo significherebbe aver bisogno di una
tabella per ogni combinazione di x e σ. Per evitare tutto ciò si è pensato di
operare sulla curva di Gauss in modo da renderla indipendente da x e σ, ottenendo
così quella che si chiama Curva di Gauss Standardizzata.
Se esprimiamo tutti i valori di x in funzione di σ e di x ponendo:
x = x + zσ
(2.9.5)
Differenziando:
dx = σdz
(2.9.6)
e sostituendo questi valori (2.9.5) e (2.9.6) nella (2.9.4):
Politecnico di Bari – Riservato alla circolazione interna
28
Prof. Ing. Michele Marra - Appunti delle Lezioni di Ricerca Operativa - Concetti generali sulla statistica
P ( x ) dx =
dalla (2.9.5) otteniamo: x - x = z σ
1
2π σ
∗e
−
( x − x) 2
2σ 2
σdz
e quindi:
z2
−
1
P ( x) dx =
∗ e 2 dz
2π
Abbiamo ottenuto una nuova espressione di P(x)dx che dipende solo dalla variabile
z che rappresenta la percentuale di variazione rispetto alla media in funzione della
σ.
Segue quindi che ad ogni valore di x e ad ogni valore di σ corrisponde una
particolare funzione ottenibile variando solo i valori di z. Abbiamo così ottenuto
una curva di Gauss che è tabellabile in funzione dello scarto rispetto al valore
medio espresso in funzione del valore di σ.
Introduciamo a questo punto il concetto di concetto di funzione di distribuzione
cumulativa.
La funzione di distribuzione cumulativa per una variabile aleatoria continua X è definita
come la probabilità che la variabile X assuma un qualsiasi valore minore di un valore x:
La funzione di distribuzione cumulativa è una caratteristica di una variabile aleatoria.
Essa esiste per tutte le variabili aletorie, siano esse discrete o continue.
Vediamone ora alcune proprietà fondamentali:
1) La funzione cumulativa F(x) è una funzione non decrescente, vale a dire che per x2>
x1 ha F(x2)≥F(x1).
2) Quando l'argomento x della funzione tende a - ∞ la funzione di distribuzione tende a
zero:
F(-∞)=0
3) Quando invece l'argomento x tende a +∞ la funzione di distribuzione tende a uno:
F(+∞) = 1
Senza dare una dimostrazione rigorosa di queste proprietà vediamo come esse siano di
facile comprensione attraverso un esempio che, per facilitare la comprensione, viene
presentato inizialmente per variabili discrete.
Supponiamo di avere una variabile aleatoria discreta che può assumere solo cinque
valori: le probabilità di ottenere i singoli valori sono raccolte nella tabella seguente.
Politecnico di Bari – Riservato alla circolazione interna
29
Prof. Ing. Michele Marra - Appunti delle Lezioni di Ricerca Operativa - Concetti generali sulla statistica
Andiamo ora a "costruire" la funzione di distribuzione cumulativa, tenendo presente che
F(X) = P(X<x) = ∑ P( X = xi )
xi < x
dove la disuguaglianza xi<x sotto il segno di sommatoria significa che questa è estesa a
tutti gli xi inferiori ad x.
Per cui abbiamo
•
Il grafico di tale funzione è dunque il seguente:
Definita la funzione di distribuzione cumulativa, vediamo cosa succede se consideriamo
la probabilità che la variabile assuma un qualsiasi valore entro un intervallo di estremi
x1 e x2 : avremo allora
P(x1≤X≤x2)= F(x2)- F(x1)
Operando un processo al limite, per cui il rapporto tra la differenza della funzione di
distribuzione cumulativa e l'intervallo stesso è la derivata,
⎡ F ( x + Δx) − F ( x) ⎤ dF ( x)
lim ⎢
⎥⎦ = dx
Δx → 0
Δx
⎣
si definisce la densità di probabilità o funzione di distribuzione:
p(x)= dF(x)/dx
La funzione p(x) caratterizza la densità di distribuzione dei valori della variabile
aleatoria in un dato punto x: la densità di probabilità è una delle forme per esprimere la
legge di distribuzione delle variabili aleatorie.
Le distribuzioni di Bernoulli, di Poisson, e di Gauss consentono di stabilire, anche se
in prima approssimazione con un semplice confronto, se le frequenze relative
che determinano sperimentalmente su un dato campione, sono assimilabili a quelle
calcolate con una delle formule viste. Sottolineamo
che
questo
è
valido
solo in prima approssimazione, infatti esistono test statistici che consentono di
valutare con quale probabilità queste ipotesi che noi facciamo sono accettabili.
Politecnico di Bari – Riservato alla circolazione interna
31
Prof. Ing. Michele Marra - Appunti delle Lezioni di Ricerca Operativa - Concetti generali sulla statistica
Esercizio n. 2.9.1
Un processo produttivo sotto controllo presenta le seguenti caratteristiche:
μ= 220 σ = 15.
Le tolleranze sono stabilite in 220 + 40.
Quale percentuale di pezzi difettosi ci si può aspettare?
La percentuale di pezzi difettosi sarà:
q = 1- P(180 < x <260)
Se x1 = 180 e x2 = 260 la variabile standardizzata z assumerà i valori:
z1 =
180 − 220
= −2,65
15
e
z2 =
260 − 220
= 2,65
15
P(180 < x < 260) = P (-2,65 < z < 2,65) =
2 , 65
=
∫
−∞
⎡ 2 , 65
⎤
f ( z ) dz − ⎢1 − ∫ f ( z ) dz ⎥ = 0,9960 −1 + 0,9960 = 0,9920
⎣ −∞
⎦
per cui q = 1 - p = 1 - 0,9920 = 0,008.
Ci si può attendere una proporzione di produzione difettosa pari all'8 per mille.
Esercizio n.2.9. 2
Assegnata una distribuzione gaussiana di media μ e scostamento quadratico medio σ :
si voglia definire la percentuale dei valori che la variabile x assume in prefissati
intervalli:
tabella 4
7,96 %
μ ± 0,1 σ
15,86 %
μ ± 0,2 σ
23,56 %
μ ± 0,3 σ
31,08 %
μ ± 0,4 σ
38,30 %
μ ± 0,5 σ
σ
68,26 %
μ ±1
86,64 %
μ ± 1,5 σ
95,00 %
μ ± 1,96 σ
σ
95,46 %
μ ±2
σ
99,74 %
μ ±3
I valori indicati sono così ricavati:
μ + 0 ,1σ
⎡ 0,1
⎤
f
z
dz
f
z
dz
f
z
dz
f
z
dz
f
z
dz
(
)
=
(
)
=
(
)
=
(
)
−
1
−
(
)
⎢
⎥=
∫
∫
∫
∫
∫
−0 ,1
−∞
0−0 ,1⋅1
μ −0 ,1σ
⎣ −∞
⎦
0+ 0 ,1⋅1
0 ,1
0 ,1
0 ,1
= 2 ∫ f ( z ) dz − 1 = 2 × 0,5398 − 1 = 1,0796 − 1 =
−∞
= 0,0786 = 7,86%
Politecnico di Bari – Riservato alla circolazione interna
32
Prof. Ing. Michele Marra - Appunti delle Lezioni di Ricerca Operativa - Concetti generali sulla statistica
In base alla tabella 4 ed alla tabella 3 si può redigere la seguente tabella che indica la
percentuale di valori che può assumere la variabile x (distribuita normalmente) minori
od uguali ad un valore prefissato.
Tabella 5
Perc.. di val.
Valori di x < α
-∞
0%
0,13 %
μ -3 σ
0,62 %
μ -2,5 σ
2,27 %
μ -2 σ
6,68 %
μ -1,5 σ
15,87 %
μ -σ
30,85 %
μ -0,5 σ
μ
50 %
69,15 %
μ +0,5 σ
84,13 %
μ +σ
93,32 %
μ +1,5 σ
97,73 %
μ +2 σ
99,38 %
μ +2,5 σ
99,87 %
μ +3 σ
I valori della tabella 5 si ricavano nel modo seguente:
−3σ
∫
−∞
−3
f ( z ) dz =
∫
3
f ( z ) dz = 1 −
−∞
∫ f ( z ) dz
= 1 − 0,9987
−∞
=0, 0013 = 0,13%
Esercizio n. 2.9.3
Esercizio sulla normalità di una distribuzione
Assegnati i dati relativi al carico di rottura dei pezzi di un lotto in Kg/cm2 riportati nella
tabella 6.
Tabella 6
623 820 835 544 768 526 791 615 758 752
827 532 573 1016 854 1026 905 834 832 756
481 722 984 915 581 754 702 571 648 873
738 830 865 854 605 608 658 742 955 651
926 758 431 625 792 756 715 576 735 426
621 634 723 776 826 894 873 851 956 584
837 796 637 875 763 432 610 726 656 855
785 682 756 683 691 784 636 682 1072 748
795 936 644 743 1078 605 942 736 890 654
1058 526 782 843 938 970 533 743 856 918
Che hanno:
2
μ = 755 kg/cm
media aritmetica
2
scarto quadratico medio
σ = 144 kg/cm
Politecnico di Bari – Riservato alla circolazione interna
32
Prof. Ing. Michele Marra - Appunti delle Lezioni di Ricerca Operativa - Concetti generali sulla statistica
Calcoliamo quale è la percentuale dei dati assegnati che hanno un valore minore o
uguale a quello indicato nella tabella 7.
Tabella 7
Valore inferiore od uguale a
μ -3
μ -2,5
μ -2
μ -1,5
μ μ -0,5
μ
μ +0,5
μ +
μ +1,5
μ +2
μ +2,5
μ +3
σ = 755 - 3
σ = 755 - 2,5
σ = 755 - 2
σ = 755 - 1,5
σ = 755 - 1
σ = 755 - 0,5
= 755
σ = 755 + 0,5
σ = 755 + 1
σ = 755 + 1,5
σ = 755 + 2
σ = 755 + 2,5
σ = 755 + 3
x 144 =
x 144 =
x 144 =
x 144 =
x 144 =
x 144 =
x 144 =
x 144 =
x 144 =
x 144 =
x 144 =
x 144 =
x 144 =
323
395
467
539
611
683
755
827
899
971
1043
1115
1187
Perc.
eff. di
dati
0%
0%
3%
8%
18 %
33 %
48 %
69 %
84 %
94 %
97 %
100 %
100 %
Kg/cm2
Kg/cm2
Kg/cm2
Kg/cm2
Kg/cm2
Kg/cm2
Kg/cm2
Kg/cm2
Kg/cm2
Kg/cm2
Kg/cm2
Kg/cm2
Kg/cm2
Perc. che risulterebbe se
i dati fossero distribuiti
normalmente
0,13 %
0,62 %
2,27 %
6,68 %
15,87 %
30,85 %
50,00 %
69,15 %
84,13 %
93,32 %
97,73 %
99,38 %
99,87 %
A fianco della colonna della percentuale effettiva di dati in ogni intervallo, sono
riportate le percentuali che dovrebbero risultare in ogni intervallo se i carichi di rottura
fossero distribuiti normalmente.
Dai risultati si può arguire che i carichi di rottura sono distribuiti pressochè
normalmente.
2.10. - Teorema del limite centrale
Sia f(x) una distribuzione di tipo qualsiasi con media μ e scarto medio σ finiti; se da
questa distribuzione di variabile casuale x si estraggono campioni di numerosità n0 al
crescere di n la distribuzione delle medie campionarie x approssima una distribuzione
gaussiana di media x = μ e scarto quadratico σ x =
σ
n
.
Se la distribuzione di origine è gaussiana la distribuzione delle medie campionarie
approssima ugualmente la gaussiana anche per n piccolo.
Esercizio n. 2.10.1
A titolo esemplificativo si consideri una macchina che produce pezzi con media μ = 10
e σ = 4. Estraendo un campione di 64 pezzi si desideri stimare un intervallo dentro il
quale x cada con probabilità del 90%.
Per il teorema del limite centrale la variabile casuale x è distribuita con legge gaussiana
di media μ e σ x = σ / n .
Politecnico di Bari – Riservato alla circolazione interna
33
Prof. Ing. Michele Marra - Appunti delle Lezioni di Ricerca Operativa - Concetti generali sulla statistica
Logicamente ci sono tra - ∞ e + ∞ , infiniti intervalli dentro i quali, x può cadere con
90% di probabilità ma è logico, data la forma della curva, prendere per motivi di
precisione tra tutti gli intervalli possibili, quello simmetrico rispetto a μ che risulta il
più ristretto.
Il problema diviene allora quello di trovare x 2 e x 1 = - x 2 in modo che l'area
tratteggiata sia pari a 0,9.
Si può quindi scrivere:
P ( x1 ≤ x ≤ x 2 ) = P( z1 ≤ z ≤ z 2 ) = 0,9 con z =
x−μ
σ/ n
Dalla tabella 3 si ricava facilmente z2 osservando che:
z2
1 − 0,9
∫−∞ f ( z ) dz = 0,9 + 2 = 0,95
Sulla tabella in corrispondenza di 0,95 si legge z2 = 1,65 per cui risulta :
x − 10
≤ 1,65) =
4 / 64
1
1⎞
⎛
= P⎜10 − 1,65 ⋅ < x < 10 + 1,65 ⋅ ⎟
2
2⎠
⎝
P( x1 ≤ x ≤ x 2 ) = P(−1,65 ≤
x
x=9,175
1
x=10,825
2
In genere però la media μ dell'universo non è nota e ci si troverà di fronte ad un
problema di stima di una serie di intervalli che in una certa percentuale devono
includere la media μ - come nel seguente esempio.
Esercizio n. 2.10.3
Una macchina produce pezzi con uno scarto quadratico medio σ = 4.
Un campione di 64 pezzi ha dato x = 9.
Stimare un intervallo di confidenza dello 0,9 per la media μ dei pezzi prodotti dalla
macchina.
Per la risoluzione del problema basterà risolvere l'espressione:
⎛
⎞
x−μ
≤ y2 ⎟ = 0,9
P( x1 ≤ x ≤ x 2 ) = P( y1 ≤ y ≤ y2 ) = P ⎜ y1 ≤
⎜
⎟
σ
⎝
⎠
P( y1 ⋅ σ ≤ x − μ ≤ y2 ⋅ σ ) = P( x − y1 ⋅ σ ≥ μ ≥ x − y2 ⋅ σ )
x
x
x
x
Dalla tabella 3 si legge in corrispondenza di una probabilità 0,90, y2 = 1,65 si ha quindi
y1 = -1,65 e:
4
4
9 + 1,65 ⋅
> μ > 9 − 1,65 ⋅
64
64
si ottiene:
9,822
μ
Politecnico di Bari – Riservato alla circolazione interna
8,175
34
Prof. Ing. Michele Marra - Appunti delle Lezioni di Ricerca Operativa - Concetti generali sulla statistica
che è l'intervallo di confidenza del 90%, per la media μ incognita e σ noto, si può
⎛
σ ⎞
determinare una corrispondente serie di intervalli ⎜⎜ x ± 1,65 ⎟⎟ e che circa il 90% di tali
n⎠
⎝
intervalli di confidenza, devono includere la qualntità fissa μ incognita.
Esercizio n. 2.10.4
Si abbia il campione:
19,8; 19,9; 19,9; 20,0 estratto da un universo gaussiano dotato di scarto quadratico
medio pari a: σ =0,5.
Si voglia individuare un intervallo in modo che si abbiano 0,95 probabilità che la media
dell'universo cada in quell'intervallo.
Si può dire anche che vogliamo individuare per la μ un intervallo di confidenza dello
0,95.
La media del campione è: x = 19,9
0,5
e
σx =
= 0,25
n
⎛
⎞
x−μ
P⎜ y1 <
< y2 ⎟ = 0,95
⎜
⎟
σ
⎝
⎠
Dalla tabella 3 si legge in corrispondenza di una probabilità 0,95 y2 = 1,96, quindi y1= 1,96 e:
⎛
⎞
x−μ
< 1,96 ⎟ = 0,95
P⎜ − 1,96 <
⎜
⎟
σ
⎝
⎠
19,9 − 1,96 ⋅ 0,25 < μ < 19,9 + 1,96 ⋅ 0,25
19,41 < μ < 20,39
2.11. - Verifica dell'ipotesi che la media o percentuale abbia un dato valore
Estratto un campione di n elementi da una popolazione distribuita normalmente con
media μ ignota e s. q. m. noto, si vuole verificare se, sulla scorta delle risultanze
campionarie, è valida l'ipotesi che la media incognita della popolazione sia uguale ad
uno specifico valore μ 0 .
Ora, se l'ipotesi è vera, x sarà distribuito normalmente attorno a μ 0 e con s. q. m.
vale a dire che la variabile standardizzata y0 =
σ
n
,
x − μ0
è distribuita normalmente con
σ/ n
media ε =0 e s. q. m. = 1 se l'ipotesi è vera.
Politecnico di Bari – Riservato alla circolazione interna
35
Prof. Ing. Michele Marra - Appunti delle Lezioni di Ricerca Operativa - Concetti generali sulla statistica
Verifichiamo l'ipotesi μ = μ 0 con un livello di significatività del 5% cioè scegliamo
come limite |y| = 1,96 (vedi tab. 3).
Decidiamo di rifiutare l'ipotesi se |y0| > 1,96.
L'accettiamo se |y0| < 1,96.
Esercizio n. 2.11.1
1) in un'indagine sulla spesa media per il servizio trasporto dei cittadini di una città,
effettuata su di un campione di 200 persone, è risultata una media di £. 152 al
giorno.
Si vuol verificare l'ipotesi che μ = 150, cioè che la spesa media giornaliera della
popolazione sia di 150 lire fissando un livello di significatività del 5% e conoscendo
lo scarto quadratico medio σ pari a 20.
Allora:
y0 =
x − μ0
σ/ n
=
152 − 150
= 1,41
20
200
Siccome y0 = 1,41 è compreso nell'intervallo da -1,96 a +1,96 l'ipotesi è accettata.
2) da un'altra inchiesta sulla percentuale delle famiglie di una città che consuma
cioccolato in polvere, effettuata su di un campione di 100 famiglie, è risultata una
percentuale del 12%. Si vuole verificare l'ipotesi che la percentuale della
popolazione che consuma cioccolato in polvere sia del 7% (cioè ρ = 0,07), fissato
al 5% la probabilità di errore.
ρ'−ρ 0
0,12 − 0,07
=
= +1,959
y=
0,07(1 − 0,07)
ρ 0 (1 − ρ 0 )
100
n
Siccome y =+1,959 è compreso nell'intervallo da -1,96 a 1,96 l'ipotesi andrebbe
accettata anche se ai limiti.
Esercizio n. 2.11.2
Al fine di stimare la produzione unitaria media giornaliera per operaio in una azienda si
prese un campione di 64 rilievi storici. La media risultò di 136 unità. Dalla esperienza
passata lo scarto quadratico medio risultava di 25 unità.
1) Determinare l'intervallo corrispondente ad un livello di confidenza del 95%.
25
Si ha:
n=64
σ =25
x =136
σ =
= 3,125
x
64
136 − μ
⎛
⎞
P⎜ − 1,96 <
< 1,96 ⎟ = 0,95
3,125
⎝
⎠
P(136 − 1,96x3,125 < μ < 136 + 1,96x 3,125) = 095
P(129,875 < μ < 142,125) = 0,95
L'intervallo cercato ha perciò i due estremi 129,875 e 142,125.
2) L'ipotesi x = 140 unità (l'ipotesi alternativa essendo x ≠ 140 ) è accettabile ad un
livello di significatività del 5%?
Politecnico di Bari – Riservato alla circolazione interna
36
Prof. Ing. Michele Marra - Appunti delle Lezioni di Ricerca Operativa - Concetti generali sulla statistica
Se l'ipotesi nulla x = 140 è vera, il 95% delle medie campionarie dovrebbe cadere
entro l'intervallo che ha per estremi (140-1,96x3,125) = 133,875 e
(140+1,96x3,125)=146,125.
La media ottenuta dall'esperimento effettuato pari a 136, cade entro tale intervallo.
Si accetta perciò l'ipotesi nulla formulata ( x = 140 ).
3) quanto grande si deve prendere il campione affinchè ci si possa aspettare che, con
un intervallo di confidenza del 99%, la media dell'universo sia compresa entro 5
unità della media del campione.
Il valore normalizzato y che lascia fuori l'1% dell'area della curva normale risulta,
dalle tavole, pari a 2,57 corrispondente all'area differenza di A(0,9950) - A(0,005)
per cui si può porre:
x −μ ≤ 5
− 2,57 <
con
x −μ
< 2,57
σ
n
− 2,57
da cui:
n
2,57
e quindi:
da cui, essendo
< x −μ <
2,57
n
<5
n
σ =25
n > 165,12, ovvero n> 165
Esercizio n. 2.11.3
Quante volte bisogna lanciare una moneta perché si abbia una probabilità del 90% che
la percentuale di teste uuscite sia tra 0,4 e 0,6.
Lanciare una moneta vuol dire avere o testa o croce.
P(0,4 < x <0,6) = 0,9
μ = ρ = 0,5
x −μ
<y2) = 0,9
σ
y1 = -1,65
0,5
0,5
⎛
⎞
P⎜ − 1,65 ⋅
+ 0,5 < x < 1,65 ⋅
+ 0,5 ⎟ = 0,9
n
n
⎝
⎠
0,5
0,4 ? 0,5 − 1,65 ⋅
da cui
n = 68
n
P(y1<
Esercizio n. 2.11.4
Un ricercatore deve valutare la media di una popolazione usando un campione
abbastanza numeroso da avere lo 0,95 di probabilità che la media del campione non si
scosti da quella della popolazione di più del ± 25% dello scarto quadratico medio σ
Politecnico di Bari – Riservato alla circolazione interna
37
Prof. Ing. Michele Marra - Appunti delle Lezioni di Ricerca Operativa - Concetti generali sulla statistica
)
(
P μ − 0,25 σ < x < μ + 0,25 σ = 0,95
P( y1 <
x −μ
< y 2 ) = 0,95
σ
x
y1 = -1,95
(
y2 = 1,95
P μ − 1,95 σ < x < μ + 1,95 σ
x
Si ha: 0,25 σ =1,95 σ
σ
x
)
da cui σ =
x
x
0,25
1,95
2
1,95
1,95
⎛ 1,95 ⎞
n=
n=⎜
⎟ = 61
0,25
0,25
n
⎝ 0,25 ⎠
Tale valore di n assicura con 95% di probabilità che la media del campione non si scosti
di più del ± 25% dello scarto quadratico medio σ .
Si abbia il campione:
19,8
19,9
19,9
con σ = 0,5
20,0
vogliamo individuare un intervallo in modo che si abbiano 0,95 probabilità che la media
dell'universo cada in quell'intervallo.
Si dice brevemente che vogliamo individuare un intervallo di confidenza dello 0,95.
Media del campione x =19,9
0,5
σx =
= 0,25
n =4
n
= σ⋅
⎛
⎞
x −μ
P⎜ y1 <
< y 2 ⎟ = 0,95
⎜
⎟
σx
⎝
⎠
P(− 1,95 ⋅ 0,25 + 19,9 < μ < 19,9 + 1,95 ⋅ 0,25) = 0,95
P(19,4125< μ <20,3875)=0,95
Esercizio n. 2.11.5
Un'agenzia desidera interrogare un campione di aventi diritto al voto in un certo stato
prendendolo abbastanza grande da avere l'1% di probabilità di trovare che la %
favorevole ed un candidato è minore del 50% quando in effetti è del 52%.
μ = ρ = 0,52
σ =
x
ρq
0,52 ⋅ 0,48
=
n
n
P( x < 0,50) = 0,01
⎡x −ρ
⎤
P⎢
< y 2 ⎥ = 0,01
⎢ σ
⎥
⎣ x
⎦
è il valore corrispondente all'area 0,99
Politecnico di Bari – Riservato alla circolazione interna
38
Prof. Ing. Michele Marra - Appunti delle Lezioni di Ricerca Operativa - Concetti generali sulla statistica
P⎛⎜ x < σ ⋅ y 2 + ρ ⎞⎟
x
⎝
⎠
y 2 = −2,57
0,50 = σ ⋅ y 2 + ρ =
x
0,52 ⋅ 0,48
⋅ y2 + ρ
n
da cui si ricava
0,50 = −
0,52 ⋅ 0,48
⋅ 2,57 + 0,5
n
0,50 = 0,52 − 2,57
0,52 ⋅ 0,48
n
da cui si ricava
n ≅ 3300
n ≅ 4121
Esercizio n. 2.11.6
Intervallo di confidenza per la media.
In uno studio di tempi e movimenti si è interessati a stimare il tempo medio che impiega
una segreteria per compilare un certo modulo. Un esperimento condotto su 40 impiegate
ha fornito i seguenti risultati: media x = 52,2 sec.; σ = 8,52 sec.
Supposto di poter approssimare la σ dell'universo con la σ del campione, determinare
per la media un'intervallo di confidenza dello 0,9.
σ = 8,52 sec.
⎞
⎛
x −μ
⎜
P y1 <
< y 2 ⎟ = 0,9
⎟
⎜
σ
x
⎠
⎝
x =52,2
y 1 = −1,65
p⎛⎜ x − σ ⋅ y 2 < μ < x − σ ⋅ y 1 ⎞⎟ = 0,9
x
x
⎠
⎝
8,52
σ =
y 2 = 1,65
x
40
,52
,52
< μ < 52,2 + 1,65 ⋅
52,2 − 1,65 ⋅
40
40
49,8 < μ < 54,42
Esercizio n. 2.11.7
Supponendo che le misure di un pezzo, prodotto da una certa macchina siano distribuite
secondo una curva di Gauss con μ =10 e σ = 2.
10 Si calcoli (sapendo che le tolleranze del disegno del pezzo sono 10 + 0,5
0,3) la percentuale di pezzi difettosi che ci si può aspettare dalla produzione eseguita
con la macchina in questione.
Politecnico di Bari – Riservato alla circolazione interna
39
Prof. Ing. Michele Marra - Appunti delle Lezioni di Ricerca Operativa - Concetti generali sulla statistica
Soluzione:
I pezzi sono difettosi quando hanno dimensione oltre le tolleranze:
L'area a tratti dà la percentuale di pezzi difettosi.
Si ha dunque:
10,5 − 10 ⎞
⎛ 9,7 − 10
ρ = 1 − P(9,7 ≤ x ≤ 10,5) = 1 − P⎜
≤y≤
⎟
2
⎝ 2
⎠
0 , 25
⎤
⎡0,15
= 1 − ⎢ ∫ f (z)dz − 0,5 + ∫ f (z)dz − 0,5⎥ = 1 − (0,8896 − 0,5 + 0,6026 − 0,5) = 0,8378
−∞
⎦
⎣ −∞
Esercizio n. 2.11.8
La vita media di una resistenza elettrica è di 1200 ore e lo scarto quadratico medio è di
200 ore.
Essendo disposti a tollerare fino a 400 ore in meno nella durata e supponendo gaussiana
la distribuzione delle durate, che percentuale di pezzi difettosi ci si può aspettare?
Soluzione:
L'area a tratti dà la percentuale di pezzi difettosi.
800 − 1.200 ⎞
⎛
ρ = P(d ≤ 800) = P⎜ y ≤
⎟
200
⎝
⎠
P=
−2
2
−∞
−∞
∫ f (z)dz = 1 − ∫ f (z)dz = 1 − 0,9772
P = 0,02228
Politecnico di Bari – Riservato alla circolazione interna
40
Prof. Ing. Michele Marra - Appunti delle Lezioni di Ricerca Operativa - Concetti generali sulla statistica
Nelle condizioni dell'esercizio precedente, quale percentuale di media campionaria ci si
può attendere entro l'intervallo da 1.160 a 1.240, supponendo di prendere campioni di
100 pezzi?
Soluzione:
⎛
⎞
⎜
⎟
1.160 − 1.200
1.240 − 1.200 ⎟
⎜
⎛
⎞
ρ = P⎜1.160 ≤ x ≤ 1.240 ⎟ = P
≤y≤
⎜
⎟
⎝
⎠
200
200
⎜
⎟
100
100
⎝
⎠
⎛ +2
⎞
⎜1 − ∫ f (z)dz ⎟ = 1,9544 − 1 = 0,9544
−
f
(
z
)
dz
∫−∞
⎜
⎟
⎝ −∞
⎠
2
=
Esercizio n. 2.11.9
La vita media di una resistenza elettrica è di 1200 ore con σ = 200 ore.
Modificata la produzione, un campione di 100 pezzi ha fornito una media di 1.250 ore.
Verificare l'ipotesi nulla μ = 1.200 contro l'alternativa μ ≠ 1.200 assumendo un livello
di significatività dello 2,5%.
Soluzione:
⎛
⎞
⎜
⎟
x −μ
⎜
< y 2 ⎟ = 0,975
P y1 <
⎜
⎟
σ
⎜
⎟
n
⎝
⎠
μ = 1.200
x = 1.250
Dovendo verificare l'ipotesi nulla con un livello di significatività del 2,5% (con un
livello di confidenza dello 0,975) si ottiene:
y 1 = − y 2 = 2,24
x − μ 1.250 − 1.200 50
=
=
= 2,5
σ
200
20
n
100
2,5 non è compreso nell'intervallo - 2,24; + 2,24 per cui l'ipotesi è senz'altro da scartare.
Politecnico di Bari – Riservato alla circolazione interna
41
Prof. Ing. Michele Marra - Appunti delle Lezioni di Ricerca Operativa - Concetti generali sulla statistica
Esercizio n. 2.11.10
Un'azienda ha fatto un'indagine di mercato per conoscere la percentuale di
consumatori che preferiscono la sua marca di prodotti.
Su un campione di 250 consumatori, 60 hanno risposto di preferire la marca
dell'azienda.
a) costruire l'intervallo di confidenza del 90% della percentuale vera di consumatori
che preferiscono la marca.
b) Verificare l'ipotesi ρ = 30% contro l'alternativa ρ ≠ 30% assumendo un valore di
significatività pari al 5%. Risultarono preferire la marca desiderata 96 persone.
c) Può essere accettata l'ipotesi di eguale frequenza per la marca nelle due zone? Si
assuma un livello di confidenza del 95%.
a) si accetta
σ=
60 190
⋅
250 250
σ =
x
60 190
⋅
60 ⋅ 90
250 250
=
250 3
250
⎛
⎞
60
⎜
⎟
−μ
⎜
⎟
250
< y 2 ⎟ = 0,90 determina l'intervallo cercato
La P⎜ y 1 <
60 ⋅ 90
⎜⎜
⎟⎟
250 3
⎝
⎠
⎛
⎞
60 30
⎜
⎟
−
⎜
⎟
250
100
< y 2 ⎟ = 0,95
b) P⎜ y 1 <
60 ⋅ 90
⎜⎜
⎟⎟
250 3
⎝
⎠
30
60 ⋅190 30
60 ⋅190
60
se
,
+ y1
+ y2
cade nell'intervallo
3
100
100
250
250
250 3
si accetta l'ipotesi ρ = 30%
(
)
c) consideriamo la variabile casuale δ = x 1 − x 2 di μ = 0
60 190
90 204
⋅
⋅
250
250
300
300 = 1,45 ⋅10 − 3
2
2
2
+
e σ 1, 2 = σ x + σ x =
1
2
250
300
σ 1, 2 = 0,038
ove x 1 e x 2 sono rispettivamente le medie campionarie per n1 = 250 n2 = 300.
L'ipotesi di eguale preferenza è accettata se ∂ = 0 cade nell'intervallo individuato
dalla:
Politecnico di Bari – Riservato alla circolazione interna
42
Prof. Ing. Michele Marra - Appunti delle Lezioni di Ricerca Operativa - Concetti generali sulla statistica
⎞
⎛
δ−0
P⎜ y 1 <
< y 2 ⎟ = 0,95
⎟
⎜
σ 1, 2
⎠
⎝
60
96
δ=
−
= 0,24 − 0,32 = −0,08
250 300
y 1 σ 1, 2 < δ < y 2 σ 1, 2 ;
−1,95 ⋅ 0,038 < −0,08 < 1,95 ⋅ 0,038
− 0,074 < −0,08 < 0,074
l'ipotesi non è accettabile, essendo -0,08 < - 0,074.
CAPITOLO II
2.1 - CONCETTI GENERALI SULLA STATISTICA……………….13
2.1.1. - Statistica descrittiva………………………………………………………....13
2.2. - Rappresentazione qrafìca di una distribuzione di frequenza…………………14
2.3. - Caratteristiche fondamentali di una distribuzione di frequenza……………..16
2.3.1. - Tendenza centrale……………………………………………………………16
2.3.2. – Dispersione…………………………………………………………………..17
2.4. - Variabile casuale discreta……………………………………………………..18
2.5. - Distribuzione binomiale o di Bernoulli……………………………………...19
2.5.1. - Esempi di applicazione della distribuzione binomiale …………………….21
2.6. - Distribuzione di Poisson……………………………………………………….23
2.6.1. Esercizio di confronto tra binomiale e poissoniana………………………….24
2.7. - Variabile casuale continua……………………………………………………25
2.8. - Valor medio di una variabile casuale………………………………………....26
Politecnico di Bari – Riservato alla circolazione interna
42
Prof. Ing. Michele Marra - Appunti delle Lezioni di Ricerca Operativa - Concetti generali sulla statistica
2.9. - Distribuzione di Gauss………………………………………………………………27
2.10. - Teorema del limite centrale………………………………………………………...32
2.11. - Verifica dell'ipotesi che la media o percentuale abbia un dato valore……………34
Bibliografia
A. M. Mood, F.A. Graybill, Introduction to the theory of Statistic, McGraw-Hill Book
Company, New York, 1963.
G. Togliatti, Elementi di Statistica, Clup Cooperativa libraria universitaria del Politecnico di
Milano,1973.
J. R. Benjamin, C. A. Cornell, Probability, Statistics and Decision for Civil Engineers,
McGraw-Hill Book Company, New York, 1970.
M. R. Spiegel, Theory and Problems of Statistics, Schaum Publishing Co., New York, 1961.
E. B. Haugen, Probabilistic Approach to Design, J. Wiley & Sons, London, 1968.
Politecnico di Bari – Riservato alla circolazione interna
43