p - Servizio di Hosting di Roma Tre

Controllo Statistico della Qualità
Prof.ssa P. Vicard
Elementi di base su
modello binomiale
e
modello normale
(alcune note)
Parte 1: il modello binomiale
Controllo Statistico della Qualità
Prof.ssa P. Vicard
Di fondamentale importanza nell’analisi della qualità
sono i modelli.
I due principali modelli statistico-probablistici
di riferimento sono:
1
binomiale e normale
1
Gli argomenti di questa lezione trovano trattazione teorica nel Capitolo 2 del libro di testo “Controllo statistico della qualità” di D. Montgomery.
Controllo Statistico della Qualità
Prof.ssa P. Vicard
Innanzitutto rivediamo cosa si intende per probabilità.
Si noti che la probabilità è, per definizione, un numero
compreso tra 0 e 1 (estremi inclusi):
• la probabilità di un evento è 0 se l’evento è impossibile
(tecnicamente parlando, sarebbe più corretto parlare di evento “quasi impossibile”);
• la probabilità di un evento è 1 se l’evento è certo
(tecnicamente parlando, sarebbe più corretto parlare di evento “quasi certo”)
Controllo Statistico della Qualità
Prof.ssa P. Vicard
Una variabile viene detta aleatoria (o casuale) quando non è
possibile conoscere a priori quale modalità della variabile
osserveremo.
Esempio: supponiamo di voler controllare la correttezza di
documenti prodotti presso una segreteria.
Prima di effettuare il controllo diretto di detti documenti non è
possibile sapere se questi contengano errori oppure no.
La variabile “il documento contiene errori” è casuale prima che
si vada a ispezionare il documento in quanto può assumere
valori diversi a causa di meccanismi casuali.
Per caratterizzare una variabile casuale si introduce la
distribuzione di probabilità.
Controllo Statistico della Qualità
Prof.ssa P. Vicard
Una distribuzione di probabilità è un modello matematico che
collega il “valore” (stato) della variabile, la caratteristica di
interesse (nel nostro esempio il fatto che il documento contenga
errori), alla probabilità che tale “valore” si trovi (ossia possa
essere osservato) all’interno della popolazione di riferimento.
Le distribuzioni di probabilità si distinguono tra:
•
Distribuzioni discrete quando la variabile può assumere solo
determinati valori (ad es.: presenza/assenza di errori in un
documento, numero di errori in un documento, conformità/non
conformità in un lotto di prodotti, oppure
soddisfazione/insoddisfazione, etc...)
Nel seguito tra le variabili discrete concentreremo l’attenzione
sulla distribuzione binomiale.
Controllo Statistico della Qualità
•
Prof.ssa P. Vicard
Distribuzioni continue quando la variabile da misurarsi è
espressa su scala continua (ad es. il tempo di attesa prima di
essere serviti, misura di caratteristiche fisiche di beni prodotti,
etc...)
Nel seguito, tra le variabili continue concentreremo l’attenzione
sulla distribuzione normale.
Ad esempio, la variabile “tempo di attesa prima di essere serviti” è
casuale continua:
casuale poiché questa assume valori diversi nella popolazione (quella
dei correntisti della banca) in conseguenza di meccanismi casuali;
continua perché la variabile tempo assume valori sul semiasse reale
positivo (ovvero nel continuo). Il fatto che noi la rappresentiamo in
minuti è dovuto ai limiti “umani” nella misurazione.
Controllo Statistico della Qualità
Prof.ssa P. Vicard
Due parametri molto importanti di una generica
distribuzione di probabilità di una variabile
casuale X (continua e discreta) sono:
la media µ (o valore atteso) e
la varianza σ2.
Controllo Statistico della Qualità
Prof.ssa P. Vicard
La distribuzione di probabilità di una variabile aleatoria discreta è
rappresentata dall’elenco di tutte e sole le modalità che la variabile può
assumere a ciascuna delle quali è associata la relativa probabilità.
Indichiamo con xi (i = 1,…,k) la generica modalità i della variabile casuale
X e con p(xi) la sua probabilità. La distribuzione di probabilità può essere
schematizzata come segue:
Modalità xi di X
x1
x2
…
xi
…
xk
Somma delle
probabilità
Probabilità
p(x1)
p(x2)
…
p(xi)
…
p(xk)
k
∑ p ( xi ) = 1
i =1
Controllo Statistico della Qualità
Prof.ssa P. Vicard
La media di una distribuzione di probabilità è una
misura della tendenza centrale della distribuzione:
K
µ = E( X )= ∑ xi p ( xi )
se la variabile è discreta
2
i=1
La varianza di una distribuzione è un parametro che
misura la variabilità della distribuzione:
K
2
σ =Var( X )= ∑ xi − µ p ( xi ) se la variabile è discreta
2



i=1
2



Quindi il valore atteso di una variabile casuale discreta è una media ponderata delle modalità assunte dalla variabile in cui i pesi sono le probabilità
associate a ciascuna modalità.
Controllo Statistico della Qualità
Prof.ssa P. Vicard
Per completezza si riportano di seguito anche le
definizioni generali di media e varianza di una
variabile aleatoria continua:
µ = E( X
+∞
) = ∫ xf ( x )dx
−∞
+∞ 
2

x
−
µ



−∞ 
σ 2 =Var( X ) = ∫
se la variabile è continua
f ( x )dx
se la variabile è continua
dove f(x) è la funzione di densità della variabile continua X e svolge ruolo
analogo a p(x).
Controllo Statistico della Qualità
Prof.ssa P. Vicard
La distribuzione BINOMIALE
(distribuzione discreta)
Esempio.
Un
sistema informativo
aziendale
deve
raccogliere,
processare,
immagazzinare e distribuire informazione per facilitare i processi di
pianificazione, decisione e controllo.
Tra l’altro il sistema informativo revisiona gli ordini di vendita per
individuare eventuali errori nella forma o nel contenuto. Gli ordini
giudicati scorretti vengono segnalati alla società mediante un rapporto
dettagliato.
Controllo Statistico della Qualità
Prof.ssa P. Vicard
Presso una casa farmaceutica, si stima pari a 0.1 la probabilità
che un singolo ordine venga giudicato scorretto.
Domanda
Se in un giorno vengono realizzati 5
ordini di vendita, qual è la probabilità
che nessuno di questi sia giudicato
scorretto?
Controllo Statistico della Qualità
Prof.ssa P. Vicard
Il modello binomiale
consente di rispondere alla domanda.
Il modello binomiale si applica a processi che consistono in una
serie di prove (n prove) indipendenti l’una dall’altra e che si
assume vengano effettuate tutte nelle medesime condizioni.
Nel nostro esempio le prove sono 5 (n=5) e si assume che le
stesure degli ordini di vendita siano indipendenti l’una
dall’altra e che la probabilità di fallire in ciascuna prova sia
sempre la stessa.
Controllo Statistico della Qualità
Prof.ssa P. Vicard
Cosa significa indipendenti?
Significa che si assume che gli ordini vengano redatti in modo
del tutto indipendente. Il fatto che uno sia scritto in modo
corretto/errato non implica o rende più probabile che anche un
altro ordine sia scritto in modo corretto/errato.
L’analisi svolta in questo esempio è un’analisi della difettosità. Essa,
quindi, è volta ad individuare e controllare gli errori (difetti) al fine di
limitarli o eliminarli. Pertanto il risultato di ogni prova è classificato come
- successo (nell’esempio è un “successo” la segnalazione al sistema
informativo della scorrettezza di un ordine di vendita) o come
- insuccesso (nell’esempio in un ordine di vendita non è riscontrato alcun
difetto, pertanto tale ordine di vendita è giudicato corretto).
Controllo Statistico della Qualità
Prof.ssa P. Vicard
Si assume che la probabilità p di successo sia la stessa in ogni prova
(ossia nella produzione di ogni ordine di vendita).
La distribuzione binomiale è la legge della variabile casuale
che rappresenta il numero di successi ottenuti in una serie di n
prove indipendenti.
Nota: Le osservazioni da una distribuzione binomiale possono essere ottenute
con due diversi metodi di campionamento: un campionamento da
popolazione infinita senza reimmissione oppure un campionamento da
popolazione finita con reimmissione.
Controllo Statistico della Qualità
Prof.ssa P. Vicard
Nel nostro esempio la variabile “n° di successi” (ossia n° documenti
errati) può assumere i valori 0, 1, 2, 3, 4, 5 perché l’interesse si
riferisce a n=5 documenti.
In generale, quindi, su n osservazioni il numero di successi può
assumere come valori tutti i numeri interi compresi tra 0 e n.
Le probabilità dei possibili risultati si calcolano mediante la definizione
della distribuzione binomiale.
Si indichi con X la variabile “n° di successi”.
Con x indichiamo un generico possibile valore di X compreso tra 0 e n
estremi inclusi3.
(Nel nostro esempio x assume valori tra 0 e 5).
3
L’uso della lettera maiuscola indica che ci si riferisce a una variabile casuale (prima che questa venga osservata) mentre l’uso della lettera minuscola indica che ci si riferisce ad
una determinazione (cioè uno stato osservato) della variabile casuale.
Controllo Statistico della Qualità
Prof.ssa P. Vicard
La distribuzione binomiale, indicata sinteticamente con Bin(n, p) è così definita:
 n x
(
)
p ( x ) = P X = x =   p (1 − p )n− x
 x
x = 0,…, n
 n
  è il coefficiente binomiale e conta il numero delle combinazioni che
 x
contengono x successi e n – x insuccessi .
 n
n!
 =
 x  x!(n − x )!
n!= n × (n − 1) × (n − 2 ) × … × 2 × 1 è detto n fattoriale
e, per convenzione, si ha 0!=1.
Controllo Statistico della Qualità
Prof.ssa P. Vicard
Questa probabilità può essere calcolata avvalendosi di software come Excel
(usando la funzione statistica DISTRIB.BINOM fino a Excel 2007 e
DISTRIB.BINOM.N per Excel 2010)
Si noti che nel
campo “Cumulativo”
va inserito:
- “falso” se si vuole
calcolare P(X=x),
ossia la probabilità
di un preciso valore
di X;
- “vero” se si
desidera calcolare la
P(X≤x), ossia la
probabilità che X
assuma valori al più
pari a x.
Controllo Statistico della Qualità
Prof.ssa P. Vicard
La probabilità può essere anche calcolata usando i pacchetti statistici
(per esempio Minitab mediante la finestra “calc”, scegliendo
“probability distributions” e nel quadro che si apre cliccando su
“binomial”. Nel quadro che si apre si chiede in output: probability
se, come in questo caso, si desidera la probabilità di un singolo
stato, ossia P(X=x); cumulative probability se si desidera una
probabilità cumulata ovvero di osservare un numero di ordini
scorretti fino a un massimo di x, ossia P(X ≤ x)
Controllo Statistico della Qualità
Prof.ssa P. Vicard
Vediamo come calcolare senza ausilio di PC la probabilità sopra.
Nel nostro esempio, sapendo che la probabilità che un generico ordine di
vendita sia errato è pari a 0.1 (p=0.1),
- la probabilità che su 5 ordini di vendita 0 siano giudicati errati (ossia
x=0) è:
 5 0
5!
5−0
p(0) = P( X = 0) =   0.1 (1 − 0.1) =
0.95 = 0.95 = 0.5905
0!( 5 − 0 )!
 0
- la probabilità che su 5 ordini di vendita 2 siano giudicati errati (ossia
x=2) è:
 5 2
5!
5−2
p( 2) = P( X = 2) =  0.1 (1 − 0.1) =
0.120.93 =
2!(5 − 2)!
 2
5 × 4 × 3 × 2 ×1 2 3
=
0.1 0.9 = 10 × 0.120.93 = 0.0729
2 × 1× (3 × 2 × 1)
è pari a 10 il numero delle combinazioni di 2
successi (documenti errati) e tre insuccessi
(documenti corretti)
Controllo Statistico della Qualità
Prof.ssa P. Vicard
Il grafico della distribuzione binomiale per n=5 e p=0.1 è
Chart of probabilità vs n° successi
0.6
0.5
probabilità
0.4
0.3
0.2
0.1
0.0
0
1
2
3
n° successi
4
5
Controllo Statistico della Qualità
Prof.ssa P. Vicard
La media e la varianza sono:
µ = np
σ 2 = np(1 − p )
Nel nostro esempio il numero medio di ordini errati è
µ = np = 5 × 0.1 = 0.5
La varianza è
σ 2 = np(1 − p ) = 5 × 0.1× (1 − 0.1) = 0.45
L’esempio utilizzato mostra quanto la distribuzione binomiale sia
importante nel controllo statistico di qualità (principalmente con
riferimento alla produzione di servizi in cui le caratteristiche di qualità
sono spesso non misurabili e, cioè, non rappresentabili mediante variabili
continue).
Controllo Statistico della Qualità
Prof.ssa P. Vicard
Una variabile che si trova frequentemente, sotto forma di indicatori, nell’analisi
statistica della qualità è la proporzione (o frazione) di successi sul numero totale
di prove effettuate.
X
Questa quantità viene indicata con pˆ =
n
dove X ha distribuzione binomiale con parametri n e p.
Nell’ambito del controllo di qualità p̂ è detto frazione campionaria di
elementi difettosi (o frazione campionaria di difettosità) in quanto è la
frazione dei pezzi risultati non conformi in un campione sul numero totale
dei pezzi del campione.
Il “cappello” ^ sulla lettera p indica che si tratta di frazione stimata (a partire da
un campione) e non reale (ossia relativa alla popolazione di riferimento).
La media e la varianza di p̂ sono: µ pˆ = p
σ 2pˆ
p(1 − p )
=
n