Controllo Statistico della Qualità Prof.ssa P. Vicard Elementi di base su modello binomiale e modello normale (alcune note) Parte 1: il modello binomiale Controllo Statistico della Qualità Prof.ssa P. Vicard Di fondamentale importanza nell’analisi della qualità sono i modelli. I due principali modelli statistico-probablistici di riferimento sono: 1 binomiale e normale 1 Gli argomenti di questa lezione trovano trattazione teorica nel Capitolo 2 del libro di testo “Controllo statistico della qualità” di D. Montgomery. Controllo Statistico della Qualità Prof.ssa P. Vicard Innanzitutto rivediamo cosa si intende per probabilità. Si noti che la probabilità è, per definizione, un numero compreso tra 0 e 1 (estremi inclusi): • la probabilità di un evento è 0 se l’evento è impossibile (tecnicamente parlando, sarebbe più corretto parlare di evento “quasi impossibile”); • la probabilità di un evento è 1 se l’evento è certo (tecnicamente parlando, sarebbe più corretto parlare di evento “quasi certo”) Controllo Statistico della Qualità Prof.ssa P. Vicard Una variabile viene detta aleatoria (o casuale) quando non è possibile conoscere a priori quale modalità della variabile osserveremo. Esempio: supponiamo di voler controllare la correttezza di documenti prodotti presso una segreteria. Prima di effettuare il controllo diretto di detti documenti non è possibile sapere se questi contengano errori oppure no. La variabile “il documento contiene errori” è casuale prima che si vada a ispezionare il documento in quanto può assumere valori diversi a causa di meccanismi casuali. Per caratterizzare una variabile casuale si introduce la distribuzione di probabilità. Controllo Statistico della Qualità Prof.ssa P. Vicard Una distribuzione di probabilità è un modello matematico che collega il “valore” (stato) della variabile, la caratteristica di interesse (nel nostro esempio il fatto che il documento contenga errori), alla probabilità che tale “valore” si trovi (ossia possa essere osservato) all’interno della popolazione di riferimento. Le distribuzioni di probabilità si distinguono tra: • Distribuzioni discrete quando la variabile può assumere solo determinati valori (ad es.: presenza/assenza di errori in un documento, numero di errori in un documento, conformità/non conformità in un lotto di prodotti, oppure soddisfazione/insoddisfazione, etc...) Nel seguito tra le variabili discrete concentreremo l’attenzione sulla distribuzione binomiale. Controllo Statistico della Qualità • Prof.ssa P. Vicard Distribuzioni continue quando la variabile da misurarsi è espressa su scala continua (ad es. il tempo di attesa prima di essere serviti, misura di caratteristiche fisiche di beni prodotti, etc...) Nel seguito, tra le variabili continue concentreremo l’attenzione sulla distribuzione normale. Ad esempio, la variabile “tempo di attesa prima di essere serviti” è casuale continua: casuale poiché questa assume valori diversi nella popolazione (quella dei correntisti della banca) in conseguenza di meccanismi casuali; continua perché la variabile tempo assume valori sul semiasse reale positivo (ovvero nel continuo). Il fatto che noi la rappresentiamo in minuti è dovuto ai limiti “umani” nella misurazione. Controllo Statistico della Qualità Prof.ssa P. Vicard Due parametri molto importanti di una generica distribuzione di probabilità di una variabile casuale X (continua e discreta) sono: la media µ (o valore atteso) e la varianza σ2. Controllo Statistico della Qualità Prof.ssa P. Vicard La distribuzione di probabilità di una variabile aleatoria discreta è rappresentata dall’elenco di tutte e sole le modalità che la variabile può assumere a ciascuna delle quali è associata la relativa probabilità. Indichiamo con xi (i = 1,…,k) la generica modalità i della variabile casuale X e con p(xi) la sua probabilità. La distribuzione di probabilità può essere schematizzata come segue: Modalità xi di X x1 x2 … xi … xk Somma delle probabilità Probabilità p(x1) p(x2) … p(xi) … p(xk) k ∑ p ( xi ) = 1 i =1 Controllo Statistico della Qualità Prof.ssa P. Vicard La media di una distribuzione di probabilità è una misura della tendenza centrale della distribuzione: K µ = E( X )= ∑ xi p ( xi ) se la variabile è discreta 2 i=1 La varianza di una distribuzione è un parametro che misura la variabilità della distribuzione: K 2 σ =Var( X )= ∑ xi − µ p ( xi ) se la variabile è discreta 2 i=1 2 Quindi il valore atteso di una variabile casuale discreta è una media ponderata delle modalità assunte dalla variabile in cui i pesi sono le probabilità associate a ciascuna modalità. Controllo Statistico della Qualità Prof.ssa P. Vicard Per completezza si riportano di seguito anche le definizioni generali di media e varianza di una variabile aleatoria continua: µ = E( X +∞ ) = ∫ xf ( x )dx −∞ +∞ 2 x − µ −∞ σ 2 =Var( X ) = ∫ se la variabile è continua f ( x )dx se la variabile è continua dove f(x) è la funzione di densità della variabile continua X e svolge ruolo analogo a p(x). Controllo Statistico della Qualità Prof.ssa P. Vicard La distribuzione BINOMIALE (distribuzione discreta) Esempio. Un sistema informativo aziendale deve raccogliere, processare, immagazzinare e distribuire informazione per facilitare i processi di pianificazione, decisione e controllo. Tra l’altro il sistema informativo revisiona gli ordini di vendita per individuare eventuali errori nella forma o nel contenuto. Gli ordini giudicati scorretti vengono segnalati alla società mediante un rapporto dettagliato. Controllo Statistico della Qualità Prof.ssa P. Vicard Presso una casa farmaceutica, si stima pari a 0.1 la probabilità che un singolo ordine venga giudicato scorretto. Domanda Se in un giorno vengono realizzati 5 ordini di vendita, qual è la probabilità che nessuno di questi sia giudicato scorretto? Controllo Statistico della Qualità Prof.ssa P. Vicard Il modello binomiale consente di rispondere alla domanda. Il modello binomiale si applica a processi che consistono in una serie di prove (n prove) indipendenti l’una dall’altra e che si assume vengano effettuate tutte nelle medesime condizioni. Nel nostro esempio le prove sono 5 (n=5) e si assume che le stesure degli ordini di vendita siano indipendenti l’una dall’altra e che la probabilità di fallire in ciascuna prova sia sempre la stessa. Controllo Statistico della Qualità Prof.ssa P. Vicard Cosa significa indipendenti? Significa che si assume che gli ordini vengano redatti in modo del tutto indipendente. Il fatto che uno sia scritto in modo corretto/errato non implica o rende più probabile che anche un altro ordine sia scritto in modo corretto/errato. L’analisi svolta in questo esempio è un’analisi della difettosità. Essa, quindi, è volta ad individuare e controllare gli errori (difetti) al fine di limitarli o eliminarli. Pertanto il risultato di ogni prova è classificato come - successo (nell’esempio è un “successo” la segnalazione al sistema informativo della scorrettezza di un ordine di vendita) o come - insuccesso (nell’esempio in un ordine di vendita non è riscontrato alcun difetto, pertanto tale ordine di vendita è giudicato corretto). Controllo Statistico della Qualità Prof.ssa P. Vicard Si assume che la probabilità p di successo sia la stessa in ogni prova (ossia nella produzione di ogni ordine di vendita). La distribuzione binomiale è la legge della variabile casuale che rappresenta il numero di successi ottenuti in una serie di n prove indipendenti. Nota: Le osservazioni da una distribuzione binomiale possono essere ottenute con due diversi metodi di campionamento: un campionamento da popolazione infinita senza reimmissione oppure un campionamento da popolazione finita con reimmissione. Controllo Statistico della Qualità Prof.ssa P. Vicard Nel nostro esempio la variabile “n° di successi” (ossia n° documenti errati) può assumere i valori 0, 1, 2, 3, 4, 5 perché l’interesse si riferisce a n=5 documenti. In generale, quindi, su n osservazioni il numero di successi può assumere come valori tutti i numeri interi compresi tra 0 e n. Le probabilità dei possibili risultati si calcolano mediante la definizione della distribuzione binomiale. Si indichi con X la variabile “n° di successi”. Con x indichiamo un generico possibile valore di X compreso tra 0 e n estremi inclusi3. (Nel nostro esempio x assume valori tra 0 e 5). 3 L’uso della lettera maiuscola indica che ci si riferisce a una variabile casuale (prima che questa venga osservata) mentre l’uso della lettera minuscola indica che ci si riferisce ad una determinazione (cioè uno stato osservato) della variabile casuale. Controllo Statistico della Qualità Prof.ssa P. Vicard La distribuzione binomiale, indicata sinteticamente con Bin(n, p) è così definita: n x ( ) p ( x ) = P X = x = p (1 − p )n− x x x = 0,…, n n è il coefficiente binomiale e conta il numero delle combinazioni che x contengono x successi e n – x insuccessi . n n! = x x!(n − x )! n!= n × (n − 1) × (n − 2 ) × … × 2 × 1 è detto n fattoriale e, per convenzione, si ha 0!=1. Controllo Statistico della Qualità Prof.ssa P. Vicard Questa probabilità può essere calcolata avvalendosi di software come Excel (usando la funzione statistica DISTRIB.BINOM fino a Excel 2007 e DISTRIB.BINOM.N per Excel 2010) Si noti che nel campo “Cumulativo” va inserito: - “falso” se si vuole calcolare P(X=x), ossia la probabilità di un preciso valore di X; - “vero” se si desidera calcolare la P(X≤x), ossia la probabilità che X assuma valori al più pari a x. Controllo Statistico della Qualità Prof.ssa P. Vicard La probabilità può essere anche calcolata usando i pacchetti statistici (per esempio Minitab mediante la finestra “calc”, scegliendo “probability distributions” e nel quadro che si apre cliccando su “binomial”. Nel quadro che si apre si chiede in output: probability se, come in questo caso, si desidera la probabilità di un singolo stato, ossia P(X=x); cumulative probability se si desidera una probabilità cumulata ovvero di osservare un numero di ordini scorretti fino a un massimo di x, ossia P(X ≤ x) Controllo Statistico della Qualità Prof.ssa P. Vicard Vediamo come calcolare senza ausilio di PC la probabilità sopra. Nel nostro esempio, sapendo che la probabilità che un generico ordine di vendita sia errato è pari a 0.1 (p=0.1), - la probabilità che su 5 ordini di vendita 0 siano giudicati errati (ossia x=0) è: 5 0 5! 5−0 p(0) = P( X = 0) = 0.1 (1 − 0.1) = 0.95 = 0.95 = 0.5905 0!( 5 − 0 )! 0 - la probabilità che su 5 ordini di vendita 2 siano giudicati errati (ossia x=2) è: 5 2 5! 5−2 p( 2) = P( X = 2) = 0.1 (1 − 0.1) = 0.120.93 = 2!(5 − 2)! 2 5 × 4 × 3 × 2 ×1 2 3 = 0.1 0.9 = 10 × 0.120.93 = 0.0729 2 × 1× (3 × 2 × 1) è pari a 10 il numero delle combinazioni di 2 successi (documenti errati) e tre insuccessi (documenti corretti) Controllo Statistico della Qualità Prof.ssa P. Vicard Il grafico della distribuzione binomiale per n=5 e p=0.1 è Chart of probabilità vs n° successi 0.6 0.5 probabilità 0.4 0.3 0.2 0.1 0.0 0 1 2 3 n° successi 4 5 Controllo Statistico della Qualità Prof.ssa P. Vicard La media e la varianza sono: µ = np σ 2 = np(1 − p ) Nel nostro esempio il numero medio di ordini errati è µ = np = 5 × 0.1 = 0.5 La varianza è σ 2 = np(1 − p ) = 5 × 0.1× (1 − 0.1) = 0.45 L’esempio utilizzato mostra quanto la distribuzione binomiale sia importante nel controllo statistico di qualità (principalmente con riferimento alla produzione di servizi in cui le caratteristiche di qualità sono spesso non misurabili e, cioè, non rappresentabili mediante variabili continue). Controllo Statistico della Qualità Prof.ssa P. Vicard Una variabile che si trova frequentemente, sotto forma di indicatori, nell’analisi statistica della qualità è la proporzione (o frazione) di successi sul numero totale di prove effettuate. X Questa quantità viene indicata con pˆ = n dove X ha distribuzione binomiale con parametri n e p. Nell’ambito del controllo di qualità p̂ è detto frazione campionaria di elementi difettosi (o frazione campionaria di difettosità) in quanto è la frazione dei pezzi risultati non conformi in un campione sul numero totale dei pezzi del campione. Il “cappello” ^ sulla lettera p indica che si tratta di frazione stimata (a partire da un campione) e non reale (ossia relativa alla popolazione di riferimento). La media e la varianza di p̂ sono: µ pˆ = p σ 2pˆ p(1 − p ) = n