Prof. Ing. Michele Marra - Appunti delle Lezioni di Ricerca Operativa - Concetti generali sulla statistica CAPITOLO II 2.1 - CONCETTI GENERALI SULLA STATISTICA La statistica è l'applicazione dei metodi scientifici alla programmazione della raccolta dei dati, alla loro classificazione, elaborazione, analisi, sintesi e presentazione di conclusioni attendibili da essi. Essa può essere del tipo descrittivo (osservazione statistica) o di tipo induttivo (inferenza statistica). La statistica descrittiva consente, attraverso l'analisi di un campione di dati, di estrapolare i risultati all'universo. La statistica induttiva consente, partendo dallo stesso campione, non solo di effettuare delle previsioni per l'intero universo ma di definire una misura della validità delle previsioni fatte. Infatti col ragionamento induttivo, dall'osservazione di certi casi particolari si traggono illazioni su tutti i casi della specie in esame, che non sono certe, ma solo probabili, in quanto sono una estensione dei risultati dell'osservazione. 2.1.1. - Statistica descrittiva Il risultato di una osservazione su di uno dei fenomeni individuali è detto unità statistica (il diametro di ogni tondino, ad es.). Il risultato di una operazione compiuta sopra le unità statistiche è poi detto dato statistico (il diametro medio dei tondini esaminati, ad es.). Per procedere ad uno studio statistico è necessario effettuare delle Rilevazioni campionarie: che sono procedimenti atti a raccogliere ed analizzare pochi dati (campione) allo scopo di ottenere informazioni su di una quantità grande di elementi (universo). Quanti elementi bisogna raccogliere? La risposta precisa la si potrà dare solo quando verrà trattata la teoria della stima statistica. Si può sin d'ora anticipare però che la attendibilità della stima sull'universo aumenta in proporzione alla radice quadrata del numero dei dati osservati costituenti il campione. Il tipo di campionamento che verrà normalmente utilizzato è il campionamento casuale semplice, per il quale ogni unità statistica ha la stessa probabilità di venire scelta. In tal caso perché il campione sia rappresentativo è necessario che l'universo da cui esso viene prelevato, sia omogeneo, cioè formato da elementi simili e soggetti agli stessi fattori casuali. L'osservazione statistica si basa sull'analisi di un campione di dati, estrapolando poi i risultati ottenuti all'intero universo attraverso il calcolo di opportune caratteristiche (medie, percentuali, numeri indice) e la loro rappresentazione grafica. Ad esempio supponiamo che una azienda meccanica produca giornalmente una serie di Politecnico di Bari – Riservato alla circolazione interna 13 Prof. Ing. Michele Marra - Appunti delle Lezioni di Ricerca Operativa - Concetti generali sulla statistica pezzi di cui si vogliono conoscere le caratteristiche meccaniche. Se tale conoscenza comporta la distruzione del pezzo, è chiaro che non possiamo distruggere tutti i pezzi. Per risolvere il problema prendiamo un limitato campione di pezzi e studiamo le caratteristiche di questo. Ora, indipendentemente dalla accuratezza della rilevazione è probabile che da una semplice osservazione dei dati non riusciamo a comprendere la portata del fenomeno a meno che non organizziamo i dati a disposizione in maniera che ci aiutino a capire le leggi che lo regolano. Operazioni da effettuare sui dati : 1) Organizzarli sotto forma di distribuzione di frequenza ossia contare quante volte (frequenza assoluta) uno stesso valore è attribuito a dati diversi, e ciò a partire dal valore più piccolo, fino ad arrivare al valore più grande rilevabile dall'insieme dei dati. 2) Rappresentare graficamente la distribuzione di frequenza. L'esperienza infatti ha dimostrato che una tale rappresentazione rende molto più facilmente comprensibili le caratteristiche fondamentali della distribuzione anche per confronto con eventi simili già verificatisi in passato. Le distribuzioni di frequenza possono essere discrete o continue a seconda della natura della variabile che le misura... In ogni caso conviene normalizzare le distribuzioni di frequenza per svincolarle dal numero dei dati a disposizione. Per fare ciò basta considerare le frequenze relative intese come rapporto fra le frequenze assolute ed il numero delle misurazioni effettuate. In tal modo la somma di tutte le frequenze relative assume il valore 1 e diventa inoltre più facile il confronto con le distribuzioni teoriche note. Ottenuta la nostra distribuzione di frequenza il problema si riduce ad un semplice confronto della nostra curva con curve standard ottenute in precedenza. 2.2. - Rappresentazione qrafìca di una distribuzione di frequenza Supponiamo di avere delle grandezze continue e sia n la numerosità del campione considerato. La prima cosa da fare è organizzare questi dati in una forma opportuna, cioè ordinarli in una forma crescente individuando un valore Xmin e un valore Xmax e dividendo questo intervallo in un certo numero di parti in modo da poter vedere in questi singoli intervalli quanti dati cadono. Questo vuol dire individuare un certo numero di classi in modo tale che, noto il numero di dati entro ciascuna di queste, sia possibile fare una rappresentazione grafica della distribuzione di frequenza corrispondente. Questa rappresentazione consiste nel costruirsi un rettangolo che abbia come base un segmento proporzionale all'ampiezza della classe e come altezza un segmento proporzionale al rapporto tra la frequenza relativa e l'ampiezza della classe (fig. 1) Politecnico di Bari – Riservato alla circolazione interna 14 Prof. Ing. Michele Marra - Appunti delle Lezioni di Ricerca Operativa - Concetti generali sulla statistica b h frequenza relativa x x min max h= b Fig. 2.1 - Rappresentazione grafica della distribuzione di frequenza b= X max − X min n Il problema che si presenta per primo è quindi quello di stabilire quante classi prendere, perchè il numero di dati è limitato. Se noi prendessimo un numero piccolo di classi, avremmo un piccolo numero di rettangoli che sarebbero poco significativi; viceversa prendendo un numero elevato di classi, potremmo avere tanti rettangolini, alcuni dei quali però, potrebbero essere vuoti e altri stracolmi di dati e quindi anche in questo caso avremmo una rappresentazione poco significativa. Dobbiamo quindi trovare un opportuno numero di classi in cui suddividere il nostro intervallo (Xmin, Xmax ). Purtroppo non esiste una regola generale che indichi come ripartire il nostro intervallo. L'esperienza ha dimostrato che il numero delle classi in cui suddividere il nostro intervallo si può assumere pari a: numero di classi = n (2.1) dove n è il numero di dati del campione in esame. L'ampiezza delle classi, che indichiamo con A, è data da: A= X max − X min n Il numero delle classi che viene fuori dalla (2.1) deve essere, ovviamente, intero per cui andremo ad arrotondarlo opportunamente, per difetto o per eccesso all'intero più prossimo. Una volta individuate le classi, occorre considerare quei dati che si trovano sul confine di ciascun intervallo e stabilire se attribuirli alla classe che li precede o che li segue. Al numero di classi trovato con la (2.1) dobbiamo aggiungere quella classe che contiene un solo elemento, cioè l'estremo inferiore o l'estremo superiore dell'intervallo (Xmin o Xmax ) a seconda che abbiamo scelto di attribuire gli elementi sul confine alla classe precedente o a quella successiva, rispettivamente. Diviso il nostro campione in queste classi, andiamo a distribuire all'interno di queste i dati rilevati. In definitiva quello che otteniamo è un istogramma, cioè un insieme di rettangoli che hanno le seguenti caratteristiche: a) la base di ogni rettangolo è pari all'ampiezza A della classe; b) l'altezza è tale che l'area del rettangolo sia proporzionale alla frequenza relativa di quella classe, in altre parole è proporzionale al rapporto tra il numero di dati che cadono in quella classe e il numero totale dei dati n. Se facciamo tendere n all'infinito il numero delle classi aumenta e l'istogramma tende ad una distribuzione continua. In tal caso, se consideriamo un certo valore x che la variabile può assumere, il valore della corrispondente ordinata moltiplicata per un intervallo infinitesimo dx, darà la probabilità che il nostro dato ha di assumere quel particolare valore ydx = f(x)dx = p(x)dx Politecnico di Bari – Riservato alla circolazione interna 15 Prof. Ing. Michele Marra - Appunti delle Lezioni di Ricerca Operativa - Concetti generali sulla statistica Conseguentemente la probabilità che la nostra variabile ha di assumere un valore tra x1 e x2 sarà data da: ∫ x2 x1 p( x)dx 100 80 60 40 20 0 a) Caso di distribuzione di una variabile continua Esempio di istogramma Il discorso non cambia se la variabile è discreta; in questo caso ci riferiremo ad una curva discreta. Quindi se abbiamo un campione con n dati, invece di considerare gli intervalli compresi tra Xmin e Xmax, dobbiamo vedere qual'è la frequenza che spetta ad ogni valore discreto compreso tra Xmin e Xmax e trasformare questa frequenza da assoluta a relativa, ottenendo una serie di segmenti verticali relativi ad ogni valore che la variabile assume. b) Caso di distribuzione di variabile discreta 2.3. - Caratteristiche fondamentali di una distribuzione di frequenza Considerando un campione e organizzando i dati secondo una certa distribuzione di frequenza, si definiscono, per la variabile in questione, due parametri fondamentali: 1) tendenza centrale 2) dispersione Politecnico di Bari – Riservato alla circolazione interna 16 Prof. Ing. Michele Marra - Appunti delle Lezioni di Ricerca Operativa - Concetti generali sulla statistica La tendenza centrale ci dice quale può essere il valore più probabile di una osservazione. La dispersione invece ci indica se i dati del campione sono raccolti in un campo ristretto o largo. 2.3.1. - Tendenza centrale Esistono diversi parametri atti a misurare la tendenza centrale; i principali sono: a) la moda: è il valore che la variabile assume più frequentemente; b) la mediana: è il valore centrale della serie dei valori osservati ordinati in modo crescente. Se i nostri dati sono n, con n dispari, si sceglie come misura della tendenza centrale il valor che occupa il posto centrale. Ad esempio se ho 101 dati, la misura della tendenza centrale è data dal valore del 51 dato. Se i dati sono n, con n pari, poiché non ho un dato che si trova esattamente a metà dell'intervallo, allora come valore della mediana prendo la media aritmetica tra i due dati che si trovano in posizione centrale, cioè devo considerare la media aritmetica tra i dati di posto (n/2 + 1) e (n/2 - 1). Questo metodo non è molto usato. c) la media aritmetica di tutti i valori che la nostra variabile assume (questo è il metodo più usato), cioè: xi x = ∑n1 n (2.2) 2.3.2. – Dispersione Anche in questo caso esistono diversi metodi per valutare la dispersione. Esaminiamone alcuni: a) media degli scarti: questo metodo consiste nel prendere in considerazione gli scarti dal valor medio e farne la media. Però siccome gli scarti possono assumere sia valori positivi che negativi, all'aumentare delle osservazioni, cioè per n che tende all'infinito, questa somma tende a zero. ∑ lim n i =1 ( xi − x) =0 n Per questo motivo si preferisce ricorrere alla media dei quadrati degli scarti. In questo modo siamo sicuri che tutte le grandezze sono positive e la loro somma non tenderà più a zero. La grandezza che si ottiene è detta varianza e si indica con n ∑i=1 ( xi − x )2 2 σ = (2.3) n La teoria statistica ha dimostrato però che la migliore misura per la varianza si ottiene ponendo al denominatore della (2.3) (n-1) al posto di n. La varianza così ottenuta è detta varianza corretta: n →∞ Politecnico di Bari – Riservato alla circolazione interna 17 Prof. Ing. Michele Marra - Appunti delle Lezioni di Ricerca Operativa - Concetti generali sulla statistica ( x − x )2 ∑ i =1 i σ = n−1 2 n (2.4) Come valore della dispersione si usa quindi σ che è detta scarto quadratico medio. σ= ∑i =1 ( xi − x )2 n (2.5) n −1 b) un altro metodo è quello di considerare l'intervallo d'esistenza e prendere come misura della dispersione la differenza tra i valori degli estremi Xmin e X max (range). Questo però è un metodo grossolano, che è tuttavia usato in campo aziendale come verifica alle tolleranze di lavorazione (controllo di qualità). 2.4. - Variabile casuale discreta Una variabile casuale discreta è una quantità variabile che può assumere un nr. finito di valori reali (determinazioni) xl, x2,..., xn con probabilità, rispettivamente, p1 = f(x1), p2= f(x2), ...., pn=f(xn) tali che la loro somma è uguale ad 1. Ad esempio il punto che compare quando si lancia un dado è una variabile casuale che può assumere i valori: 1, 2, 3, ...,6 ciascuno con probabilità 1/6. I valori x1, x2, ..., xn che compaiono nella definizione di variabile casuale possono anche, in parte, coincidere. Basta riunire insieme e considerare come unico evento tutti i casi in cui x assume uno stesso valore, qualunque esso sia; a valori distinti corrisponderanno allora eventi distinti, incompatibili fra loro. Prendiamo in esame la variabile casuale, rappresentata dal "nr. di volte che appare testa" lanciando 4 volte una moneta; la faccia testa può verificarsi: X0=0 volte X1=1 volta X2=2 volte CCCT ⎧CCCT ⎪CCTC ⎪ ⎨ ⎪CTCC ⎪⎩TCCC ⎧CCTT ⎪CTCT ⎪ ⎪⎪CTTC ⎨ ⎪TCTC ⎪TTCC ⎪ ⎩⎪TCCT p0= 1 24 p1= 4 24 p2= 6 24 Politecnico di Bari – Riservato alla circolazione interna 18 Prof. Ing. Michele Marra - Appunti delle Lezioni di Ricerca Operativa - Concetti generali sulla statistica X3=3 volte ⎧CTTT ⎪TCTT ⎪ ⎨ ⎪TTCT ⎪⎩TTTC p3= X4=4 volte {TTTT p4= e deve verificarsi che ∑ 4 24 1 24 pi =1. 1 1 1 1 1 16 +4 4 +6 4 +4 4 + 4 = =1 4 2 2 2 2 2 16 Esaminiamo ora le più note distribuzioni di frequenza. ∑p i = 2.5. - Distribuzione binomiale o di Bernoulli Abbiamo visto che la probabilità di ottenere esattamente k successi in n prove ripetute viene fornita dall'espressione di Bernoulli ⎛n⎞ ⎛n⎞ Pk = ⎜⎜ ⎟⎟ p k (1 − p) n − k = ⎜⎜ ⎟⎟ p k q n − k ⎝k ⎠ ⎝k ⎠ (2.6) Se consideriamo n e p costanti, allora la suddetta funzione Pk è una distribuzione di probabilità k 0 Pn qn 1 ⎛ n ⎞ n−1 ⎜⎜ ⎟⎟q p ⎝1⎠ 2 ⎛ n ⎞ n −2 2 ⎜⎜ ⎟⎟q p ⎝ 2⎠ … … n pn Essa è detta distribuzione binomiale poiché per k=1, 2, ..., n essa corrisponde ai termini successivi dello sviluppo del binomio ⎛n⎞ ⎛n⎞ (q + p) n = q n + ⎜⎜ ⎟⎟q n −1p + ⎜⎜ ⎟⎟q n − 2 p 2 + ... + p n ⎝1⎠ ⎝ 2⎠ Viene anche detta distribuzione di Bernoulli. La distribuzione binomiale si considera ogni volta che ci troviamo di fronte a popolazioni nelle quali ci sono degli individui che presentano caratteristiche ben definite. Un esempio lampante è quello di lotti di produzione che presentano sempre un definito numero di pezzi difettosi. Facciamo subito un esempio. Supponiamo di fare un'indagine su una produzione di pezzi; supponiamo di accorgerci che il 20% di questi pezzi sono difettosi. Facciamo dei controlli periodici prendendo a caso dei campioni di 10 pezzi. Naturalmente è improbabile trovare su un campione di 10 pezzi due pezzi difettosi; però prendendo un numero molto grande di campioni da 10 pezzi sarà probabile trovare 2 pezzi difettosi come valor medio dei campioni Politecnico di Bari – Riservato alla circolazione interna 19 Prof. Ing. Michele Marra - Appunti delle Lezioni di Ricerca Operativa - Concetti generali sulla statistica considerati. Per il teorema di Bernoulli la probabilità che ha un campione di numerosità n estratto da un lotto infinito con una proporzione di difettosi p, di contenere k articoli difettosi, è data da: ⎛n⎞ Pk = ⎜⎜ ⎟⎟p k (1 − p) n − k ⎝k⎠ dove n = numerosità del lotto; p = probabilità di difetto del lotto; Se noi teniamo fissi n e p e facciamo variare k tra 0 ed n, possiamo calcolarci le corrispondenti probabilità. La distribuzione binomiale dipende quindi da due parametri, la numerosità del campione n, la probabilità di difetto p; essa è quindi biparametrica. Esempio 2.1: Sia n=10 la numerosità del lotto; p=1/5 la probabilità di difetto del lotto; k=0, 1, 2,…,10 gli articoli difettosi. Costruiamo la seguente tabella: k art. difett. 0 1 2 3 4 5 6 7 8 9 10 Totale prob.binom. freq.dei camp. freq. secondo Bernoulli con k difettosi relativa 0,1074 5 0,10 0,2684 14 0,28 0,3020 15 0,30 0,2013 10 0,20 0,0881 4 0,08 0,0264 1 0,02 0,0055 1 0,02 0,0008 0 0,00 0,0001 0 0,00 0,0000 0 0,00 0,0000 0 0,00 1,0000 N=50 1,00 Supponiamo di estrarre dal nostro universo una serie di campioni di 10 articoli ciascuno e andiamo a contare quante volte questi campioni hanno presentato un numero di articoli difettosi; supponiamo che questi siano N=50 campioni (III col.). Determiniamo la frequenza relativa con cui questi campioni hanno assunto quei valori difettosi (IV col.). Avendo preso n=10 e p=1/5, possiamo costruirci la curva binomiale teorica (II colonna). Dopo aver diagrammato le due curve, quella ottenuta con la formula di Bernoulli e quella sperimentale, se vediamo che queste si discostano notevolmente, significa che c'è qualcosa che non va nel nostro processo produttivo. Politecnico di Bari – Riservato alla circolazione interna 20 Prof. Ing. Michele Marra - Appunti delle Lezioni di Ricerca Operativa - Concetti generali sulla statistica ↑ Fig.2.4 - Confronto tra le frequenze teoriche e quelle effettive del verificarsi di campioni con x articoli difettosi (per x = 0, 1, 2, …, 10) Si può dimostrare che questa distribuzione ha media = n p e scarto quadratico medio σ = n⋅ p q 2.5.1. - Esempi di applicazione della distribuzione binomiale Esempio 2.5.1.1 - Si prenda in esame un lotto che contiene il 10% di pezzi difettosi e quindi i1 90 % di pezzi buoni. L'universo sarà allora caratterizzato da p = 0,90 e q = 0,10; la probabilità di estrarre esattamente 2 pezzi difettosi su 10 estratti, cioè di estrarre 8 pezzi buoni su 10 è: ⎛10 ⎞ P(8) = ⎜⎜ ⎟⎟ 0,98 0,10 2 = 45 × 0,430 × 46 × 721× 0,01 = 0,1937 ⎝8⎠ In media su 10 estrazioni si hanno: μ = 10 x 0.9 = 9 pezzi buoni con uno scarto quadratico medio di σ = 10 × 0,9 × 0,10 = 0,9 = 0,94 Esempio2.5.1.2 - In una città di 5000 adulti a 100 di essi viene richiesta la loro opinione su di un progetto municipale: 60 risultano favorevoli e 40 contrari. Se in effetti gli adulti della città fossero in egual numero favorevoli e contrari, quale sarebbe la probabilità di ottenere il 60% o più di favorevoli in un campione di 100. Risposta: Siamo nel caso di X successi in n prove a probabilità costante. La distribuzione di probabilità di avere x favorevoli in 100 esaminati è data da: ⎛100 ⎞ x (100− x ) ⎟⎟p q a) P( x ) = ⎜⎜ ⎝ x ⎠ Politecnico di Bari – Riservato alla circolazione interna 21 Prof. Ing. Michele Marra - Appunti delle Lezioni di Ricerca Operativa - Concetti generali sulla statistica b) Ma il testo dice numero favorevoli p = numero contrari q: p = q = 0,5 e tenendo presente che p x q (100− x ) = p100 = 0,5100 100 100 ⎞ 100 ⎛ ⎟⎟0,5 P( x ≥ 60) = ∑ ⎜⎜ x = 60⎝ x ⎠ Esempio 2.5.1.3 - Uno studente deve sostenere un esame che consiste nel dare una risposta (scelta tra cinque, di cui una sola è giusta) ad 8 domande. Posto che l'esame è superato quando si da la risposta ad almeno 3 domande, si vuole conoscere quale è la probabilità che uno studente impreparato superi l'esame. Possiamo vedere le 8 domande come una serie di 8 prove indipendenti con probabilità di avere SUCCESSO (risposta esatta 1/5 = 0,2). La probabilità da noi cercata è P(x > 3) quindi avremo: 8! (0,2)3 (0,8)5 = 0,1468 P ( x = 3) = 3!(8 − 3)! 8! (0,2) 4 (0,8) 4 = 70 × 0,0016 × 0,4096 = 0,0459 P ( x = 4) = 4!(8 − 4)! 8! P ( x = 5) = (0,2)5 (0,8)3 = 0,092 5!(8 − 5)! 8! (0,2) 6 (0,8) 2 = 0,0011 P ( x = 6) = 6!(8 − 6)! 8! P ( x = 7) = (0,2)7 (0,8)1 = 0,0001 7!(8 − 7)! P ( x = 8) = trascurabile Probabilità da noi cercata = 0,1468+ 0,0459+ 0,092 + 0,0011+ 0,0001+ 0,2859+ Lo stesso risultato si può ottenere anche e forse più semplicemente come: P(x≥3) = 1 – P(x=0) – P(x=1) – P(x=2) Esempio 2.5.1.4 - Un tiratore scelto colpisce in media 1 volta su 10 il bersaglio. Determinare la probabilità che su 20 tiri colpisca almeno 2 volte il bersaglio. E' un problema di prove ripetute che si può risolvere con la distribuzione binomiale e cioè posto: p = 1/10 ed n = 20 Politecnico di Bari – Riservato alla circolazione interna 22 Prof. Ing. Michele Marra - Appunti delle Lezioni di Ricerca Operativa - Concetti generali sulla statistica 20 si vuole conoscere P(x > 2) per cui avremo, evitando di fare la ∑ n =2 20 19 ⎛ 20 ⎞ ⎛ 1 ⎞ ⎛ 9 ⎞ ⎛9⎞ P(x > 2) = 1 - P(x = 0) - P(x = 1) = 1 − ⎜ ⎟ − ⎜⎜ ⎟⎟ ⎜⎜ ⎟⎟ ⎜ ⎟ = 0,608 ⎝ 10 ⎠ ⎝ 1 ⎠ ⎝10 ⎠ ⎝ 10 ⎠ 2.6. - Distribuzione di Poisson Supponiamo che il numero di prove n tenda all'infinito, mentre p tenda a zero; sia il prodotto m = p*n una quantità finita con m = numero medio di successi atteso in n prove indipendenti; la nuova distribuzione di frequenza così ottenuta è detta distribuzione di Poisson. In questo caso la probabilità di contenere k difettosi è: e − mmk Pk = k! La differenza tra la formula di Bernoulli e di Poisson è che la prima ci pone di fronte a due parametri (n,p), la seconda di fronte al solo parametro m. Vediamo se è vero che con la formula di Poisson possiamo costruirci una distribuzione di frequenza. Affinché ciò sia vero occorre che la somma dei valori Pk, con k=0, 1, ...., n, sia uguale ad uno, ovvero la probabilità totale deve essere uguale ad uno. Infatti: e − m m0 0! p0 + p1 + p2 +......+ pn = =e −m 1 + e 1!m + e 0 −m m 0! ( 1 −m m2 2! +.......+ e −m mn n! = 2 + m1! + m2 ! +.....) = e − m * e m = 1 dove e= 0 0! + 11! + 2 2! +.... m0 em = 0 ! 1 2 + m1! + m2 ! +...... quindi questo tipo di distribuzione è normalizzata e può essere presa come distribuzione classica. Vediamo come, praticamente, si può sfruttare la relazione di Poisson. Supponiamo che il nostro processo produttivo sia talmente sofisticato che i pezzi difettosi siano trascurabili. Osserviamo per esempio per 201 giorni i pezzi prodotti e verifichiamo se in effetti i pezzi difettosi siano trascurabili. Riportiamo le informazioni ricevute in tabella. Politecnico di Bari – Riservato alla circolazione interna 23 Prof. Ing. Michele Marra - Appunti delle Lezioni di Ricerca Operativa - Concetti generali sulla statistica num.art.difett. prodotti in 1 giorno num.gior. in cui si sono manifestati k art.difettosi 0 1 2 3 4 5 6 7 totale 102 59 31 8 0 1 0 0 201 freq. relat. sperimentale 0,5075 0,2935 0,1542 0,0398 0,0000 0,0050 0,0000 0,0000 1,0000 freq. relat. sec.Poisson 0,4741 0,3538 0,1320 0,0328 0,0061 0,0009 0,0000 0,0000 0,9997 La formula di Poisson è: −m k Pk = e km! In questa relazione non conosciamo m, cioè il numero di pezzi difettosi trovati in 201 giorni. Questo valore tuttavia può essere calcolato con la media pesata, ovvero: m= 0 ∗ 102 + 1 ∗ 59 + 2 ∗ 31 + 3 ∗ 8 + 4 ∗ 0 + 5 ∗ 1 + 6 ∗ 0 + 7 ∗ 0 = 0,7463 201 ovvero m = 0,7463. Per calcolare m non abbiamo usato né n né p. Applichiamo ora la formula di Poisson per calcolare Pk in corrispondenza di m con k variabile tra 0, ...., 7. Raccogliendo questi valori nella colonna IV, vediamo che la probabilità è pari a 0,9997. Poiché la corrispondenza fra le frequenze relative osservate e quelle calcolate è ragionevolmente stretta, concludiamo che i dati rilevati sono il risultato di condizioni che portano ad una distribuzione di Poisson, cioè gli articoli difettosi si presentano per caso e tanto raramente che il processo di produzione deve essere considerato sotto controllo e non v’è ragione di sospettare errori. D’altra parte, se le frequenze osservate non avessero avuto una ragionevole corrispondenza con le frequenze teoriche, ciò avrebbe indicato che i difetti non si verificavano casualmente, senza un preciso motivo, ma che invece derivavano da una qualche imperfezione esistente nella fase produttiva. 2.6.1. Esercizio di confronto tra binomiale e poissoniana. Si confrontino le esatte probabilità (con la distribuzione binomiale) e le probabilità approssimate (con la distribuzione di Poisson) di estrarre x = 0, 1, 2,.... pezzi buoni in 64 estrazioni indipendenti, da un lotto in cui i pezzi buoni sono 1/32 (cioè p = 1/32). La binomiale dà: x 64 − x ⎛ 64 ⎞ ⎛ 1 ⎞ ⎛ 31 ⎞ con (x=0, 1, 2, ..., 64) Pb ( x) = ⎜⎜ ⎟⎟ ⎜ ⎟ ⎜ ⎟ ⎝ x ⎠ ⎝ 32 ⎠ ⎝ 32 ⎠ Politecnico di Bari – Riservato alla circolazione interna 24 Prof. Ing. Michele Marra - Appunti delle Lezioni di Ricerca Operativa - Concetti generali sulla statistica La distribuzione di Poisson dà (essendo m = np = 64 * p(x) = e -2 2 x x! 1 32 = 2) con (x=0, 1, 2, ...., 64) Si ottiene: x 0 1 2 3 4 5 6 7 8 9 Probab. esatte p(x) 0.131 0.271 0.275 0.183 0.090 0.035 0.011 0.003 0.001 0.000 Probab. approssimate g(x) 0.135 0.271 0.271 0.180 0.090 0.036 0.012 0.004 0.001 0.000 Per m=np abbastanza grande (in pratica per m>9) la distribuzione di Poisson può essere approssimata da una distribuzione normale con media m e s.q.m. uguale a npq . Esempio 2.6.1 - Calcolare la probabilità che ci siano non più di 5 pezzi difettosi in un cassetto che contiene 200 pezzi, sapendo che in media il 2% dei pezzi è difettoso. Possiamo vedere che il termine m= 200*(0.02) = 4 pezzi difettosi, quindi applicando la distribuzione di Poisson avremo: 5 e −4 4 x g ( x ≤ 5) = ∑ = x! x =0 ⎛ 42 43 44 45 ⎞ ⎟ = 0,785 = e − 4 ⎜⎜1 + 4 + + + + 2 6 24 120 ⎟⎠ ⎝ 2.7. - Variabile casuale continua Quando la variabile casuale x può assumere qualsiasi valore reale in un certo intervallo a----b, è detta continua e la distribuzione di probabilità ad essa associata è detta distribuzione continua di probabilità; f(x) è definita nell'intervallo a----b dove assume valori non negativi, e può rappresentarsi con una curva continua tale che l'area compresa sotto la curva è uguale all'unità ∫ b a f ( x )dx = 1 Nella misurazione dello spessore di lamierini metallici, ad esempio, supponiamo di estendere la misura ad un numero infinito di lamierini e di aumentare sempre di più Politecnico di Bari – Riservato alla circolazione interna 25 Prof. Ing. Michele Marra - Appunti delle Lezioni di Ricerca Operativa - Concetti generali sulla statistica la precisione della misurazione dello spessore. Siamo così in grado di ridurre progressivamente l'intervallo della classe. Poiché lo spessore è una variabile continua, se continuiamo a misurare indefinitamente, nessuna delle nostre classi, per quanto piccolo sia il suo intervallo sarà vuota. Al contrario la frequenza assoluta di ciascun intervallo aumenterà indefinitamente. Se allora Δ fi è la frequenza della cella relativa della variabile nell'intervallo xi±1/2 Δ xi l'altezza dell'istogramma sarà data da y = Δfi Δx i . Al limite avremo una curva continua della frequenza relativa y=f(x) tale che la frequenza relativa con cui la variabile giace dentro un intervallo xi ± 1/2 dx sarà data da ydx =f(x)dx, tenendo presente la definizione di probabilità statistica, f(x)dx altro 1 non è che la probabilità dp(x) che x cada nell'intervallo x± 2 dx. Pertanto al limite l'istogramma di una variabile continua si trasforma nella curva di probabilità della variabile. Ne consegue che la probabilità che x cada in un intervallo a ≤ x ≤ b è data da: P(a≤x ≤b) = ∫ b a f(x)dx Definendo f(x)=0 nei punti fuori dal campo di definizione della variabile x, si ha: ∫ f(x) dx =1 Come risulta intuitivamente dal fatto che x deve senz'altro cadere nel proprio intervallo di definizione. Nel caso di una variabile continua x non ha senso parlare di probabilità di un valore xi, ma si può parlare soltanto di probabilità che x cada nell'intervallo xi ±1/2 dxi. In questo modo noi abbiamo dp(x)=f(x)dx dove f(x)dx viene comunemente chiamata densità di probabilità mentre la curva y=f(x) si dice curva di probabilità. 2.8. - Valor medio di una variabile casuale Se una variabile casuale X è suscettibile di una definizione concreta, i valori x1 , x2 , ...., xn di essa dovranno potersi ottenere mediante effettive esperienze, osservazioni o misure ed a ciascuno di questi valori corrisponderà una determinata frequenza che al crescere del numero delle prove si accosterà generalmente alle rispettive probabilità. Poniamo che in n prove i valori x1 ,x2 ,...., xn di X si presentino ν1, ν2,....νn volte, (ν1+ν2+....+νn)= n. Allora la media aritmetica dei valori assunti da x nelle n prove è 1 (v1x1 + v2 x2 + ... + vn xn ) = v1 x1 + v2 x2 + ... + vn xn n n n n (2.8.1) Una previsione teorica di questo valore medio empirico di X si può fare con sufficiente approssimazione (se n è abbastanza alto) quando si conoscono le probabilità p1 , p2 , ..., pn , di questi n valori. νi Basta sostituire la p alle n nella (0). Si arriva così alla nozione di valore medio teorico o valore medio di X Politecnico di Bari – Riservato alla circolazione interna 26 Prof. Ing. Michele Marra - Appunti delle Lezioni di Ricerca Operativa - Concetti generali sulla statistica M(X) = p1 x1 + p2 x2 +.....+ pn xn Il valor medio di una variabile casuale è la somma dei prodotti dei valori che essa può assumere moltiplicati per le rispettive probabilità. 2.9. - Distribuzione di Gauss Quando le grandezze in gioco sono reali, la relazione di Bernoulli, (valida per grandezze intere) si trasforma in una distribuzione continua, cioè quella di Gauss. Essa rappresenta particolarmente bene le variazioni di una grandezza sottoposta all’influenza simultanea di un insieme di cause tutte di piccola entità tra le quali nessuna prevale decisamente e che nel tempo si mantengono sufficientemente stabili (casualità). Questa distribuzione continua è esprimibile secondo la relazione: − 1 P( x) = ∗e 2π σ ( x − x)2 2σ 2 (2.9.1) Il valore di P(x) è una misura che rappresenta l'ordinata e cioè l'altezza della curva di Gauss in corrispondenza del particolare valore x. Se invece di considerare x consideriamo un intervallino dx elementare, l'area P(x)dx rappresenta la probabilità che ha la nostra variabile di assumere il valore x. Se volessimo la probabilità che ha la nostra variabile di assumere un valore compreso tra x1 e x2 , cioè in un intervallo finito, essa è data da: x2 x2 − 1 P ( x1 ≤ x ≤ x2 ) = ∫ p ( x) dx = ∫ e x1 σ 2π x1 ( x − x)2 2σ 2 dx Una distribuzione di questo tipo è difficile da utilizzare perchè dipende da due parametri, cioè x e σ. Se avessimo n valori rappresentanti un certo campione, dovremmo calcolare i valori max e min, individuare il numero di classi, calcolare la frequenza relativa e costruirci il corrispondente istogramma. Se volessimo costruirci sullo stesso diagramma cartesiano la curva di Gauss, Politecnico di Bari – Riservato alla circolazione interna 27 Prof. Ing. Michele Marra - Appunti delle Lezioni di Ricerca Operativa - Concetti generali sulla statistica dovremmo calcolare il valore medio x relativo ai nostri dati, poi calcolare la varianza, quindi assegnando ad x i valori compresi tra xmin e xmax potremmo costruire la curva di Gauss relativa a questi due parametri x e σ. La curva di Gauss ha due punti di flesso in corrispondenza di x -σ e x +σ, inoltre è asintotica verso + ∞ e - ∞ . In pratica noi consideriamo solo quella parte compresa tra i valori di x -4 σ e x +4σ, perchè tra questi due valori l'area è pari al 99,994% dell'area totale. In pratica la dispersione di questa distribuzione di frequenza è esprimibile in funzione dello scarto quadratico medio σ. La curva costruita in questa maniera è relativa ai particolari valori di x e σ, di questa curva possiamo avere bisogno di calcolare l'area all'interno di un dato intervallo (x1 ,x2 ); questo equivale a risolvere la 4), oppure bisogna ricorrere a tabelle, ma questo significherebbe aver bisogno di una tabella per ogni combinazione di x e σ. Per evitare tutto ciò si è pensato di operare sulla curva di Gauss in modo da renderla indipendente da x e σ, ottenendo così quella che si chiama Curva di Gauss Standardizzata. Se esprimiamo tutti i valori di x in funzione di σ e di x ponendo: x = x + zσ (2.9.5) Differenziando: dx = σdz (2.9.6) e sostituendo questi valori (2.9.5) e (2.9.6) nella (2.9.4): Politecnico di Bari – Riservato alla circolazione interna 28 Prof. Ing. Michele Marra - Appunti delle Lezioni di Ricerca Operativa - Concetti generali sulla statistica P ( x ) dx = dalla (2.9.5) otteniamo: x - x = z σ 1 2π σ ∗e − ( x − x) 2 2σ 2 σdz e quindi: z2 − 1 P ( x) dx = ∗ e 2 dz 2π Abbiamo ottenuto una nuova espressione di P(x)dx che dipende solo dalla variabile z che rappresenta la percentuale di variazione rispetto alla media in funzione della σ. Segue quindi che ad ogni valore di x e ad ogni valore di σ corrisponde una particolare funzione ottenibile variando solo i valori di z. Abbiamo così ottenuto una curva di Gauss che è tabellabile in funzione dello scarto rispetto al valore medio espresso in funzione del valore di σ. Introduciamo a questo punto il concetto di concetto di funzione di distribuzione cumulativa. La funzione di distribuzione cumulativa per una variabile aleatoria continua X è definita come la probabilità che la variabile X assuma un qualsiasi valore minore di un valore x: La funzione di distribuzione cumulativa è una caratteristica di una variabile aleatoria. Essa esiste per tutte le variabili aletorie, siano esse discrete o continue. Vediamone ora alcune proprietà fondamentali: 1) La funzione cumulativa F(x) è una funzione non decrescente, vale a dire che per x2> x1 ha F(x2)≥F(x1). 2) Quando l'argomento x della funzione tende a - ∞ la funzione di distribuzione tende a zero: F(-∞)=0 3) Quando invece l'argomento x tende a +∞ la funzione di distribuzione tende a uno: F(+∞) = 1 Senza dare una dimostrazione rigorosa di queste proprietà vediamo come esse siano di facile comprensione attraverso un esempio che, per facilitare la comprensione, viene presentato inizialmente per variabili discrete. Supponiamo di avere una variabile aleatoria discreta che può assumere solo cinque valori: le probabilità di ottenere i singoli valori sono raccolte nella tabella seguente. Politecnico di Bari – Riservato alla circolazione interna 29 Prof. Ing. Michele Marra - Appunti delle Lezioni di Ricerca Operativa - Concetti generali sulla statistica Andiamo ora a "costruire" la funzione di distribuzione cumulativa, tenendo presente che F(X) = P(X<x) = ∑ P( X = xi ) xi < x dove la disuguaglianza xi<x sotto il segno di sommatoria significa che questa è estesa a tutti gli xi inferiori ad x. Per cui abbiamo • Il grafico di tale funzione è dunque il seguente: Definita la funzione di distribuzione cumulativa, vediamo cosa succede se consideriamo la probabilità che la variabile assuma un qualsiasi valore entro un intervallo di estremi x1 e x2 : avremo allora P(x1≤X≤x2)= F(x2)- F(x1) Operando un processo al limite, per cui il rapporto tra la differenza della funzione di distribuzione cumulativa e l'intervallo stesso è la derivata, ⎡ F ( x + Δx) − F ( x) ⎤ dF ( x) lim ⎢ ⎥⎦ = dx Δx → 0 Δx ⎣ si definisce la densità di probabilità o funzione di distribuzione: p(x)= dF(x)/dx La funzione p(x) caratterizza la densità di distribuzione dei valori della variabile aleatoria in un dato punto x: la densità di probabilità è una delle forme per esprimere la legge di distribuzione delle variabili aleatorie. Le distribuzioni di Bernoulli, di Poisson, e di Gauss consentono di stabilire, anche se in prima approssimazione con un semplice confronto, se le frequenze relative che determinano sperimentalmente su un dato campione, sono assimilabili a quelle calcolate con una delle formule viste. Sottolineamo che questo è valido solo in prima approssimazione, infatti esistono test statistici che consentono di valutare con quale probabilità queste ipotesi che noi facciamo sono accettabili. Politecnico di Bari – Riservato alla circolazione interna 31 Prof. Ing. Michele Marra - Appunti delle Lezioni di Ricerca Operativa - Concetti generali sulla statistica Esercizio n. 2.9.1 Un processo produttivo sotto controllo presenta le seguenti caratteristiche: μ= 220 σ = 15. Le tolleranze sono stabilite in 220 + 40. Quale percentuale di pezzi difettosi ci si può aspettare? La percentuale di pezzi difettosi sarà: q = 1- P(180 < x <260) Se x1 = 180 e x2 = 260 la variabile standardizzata z assumerà i valori: z1 = 180 − 220 = −2,65 15 e z2 = 260 − 220 = 2,65 15 P(180 < x < 260) = P (-2,65 < z < 2,65) = 2 , 65 = ∫ −∞ ⎡ 2 , 65 ⎤ f ( z ) dz − ⎢1 − ∫ f ( z ) dz ⎥ = 0,9960 −1 + 0,9960 = 0,9920 ⎣ −∞ ⎦ per cui q = 1 - p = 1 - 0,9920 = 0,008. Ci si può attendere una proporzione di produzione difettosa pari all'8 per mille. Esercizio n.2.9. 2 Assegnata una distribuzione gaussiana di media μ e scostamento quadratico medio σ : si voglia definire la percentuale dei valori che la variabile x assume in prefissati intervalli: tabella 4 7,96 % μ ± 0,1 σ 15,86 % μ ± 0,2 σ 23,56 % μ ± 0,3 σ 31,08 % μ ± 0,4 σ 38,30 % μ ± 0,5 σ σ 68,26 % μ ±1 86,64 % μ ± 1,5 σ 95,00 % μ ± 1,96 σ σ 95,46 % μ ±2 σ 99,74 % μ ±3 I valori indicati sono così ricavati: μ + 0 ,1σ ⎡ 0,1 ⎤ f z dz f z dz f z dz f z dz f z dz ( ) = ( ) = ( ) = ( ) − 1 − ( ) ⎢ ⎥= ∫ ∫ ∫ ∫ ∫ −0 ,1 −∞ 0−0 ,1⋅1 μ −0 ,1σ ⎣ −∞ ⎦ 0+ 0 ,1⋅1 0 ,1 0 ,1 0 ,1 = 2 ∫ f ( z ) dz − 1 = 2 × 0,5398 − 1 = 1,0796 − 1 = −∞ = 0,0786 = 7,86% Politecnico di Bari – Riservato alla circolazione interna 32 Prof. Ing. Michele Marra - Appunti delle Lezioni di Ricerca Operativa - Concetti generali sulla statistica In base alla tabella 4 ed alla tabella 3 si può redigere la seguente tabella che indica la percentuale di valori che può assumere la variabile x (distribuita normalmente) minori od uguali ad un valore prefissato. Tabella 5 Perc.. di val. Valori di x < α -∞ 0% 0,13 % μ -3 σ 0,62 % μ -2,5 σ 2,27 % μ -2 σ 6,68 % μ -1,5 σ 15,87 % μ -σ 30,85 % μ -0,5 σ μ 50 % 69,15 % μ +0,5 σ 84,13 % μ +σ 93,32 % μ +1,5 σ 97,73 % μ +2 σ 99,38 % μ +2,5 σ 99,87 % μ +3 σ I valori della tabella 5 si ricavano nel modo seguente: −3σ ∫ −∞ −3 f ( z ) dz = ∫ 3 f ( z ) dz = 1 − −∞ ∫ f ( z ) dz = 1 − 0,9987 −∞ =0, 0013 = 0,13% Esercizio n. 2.9.3 Esercizio sulla normalità di una distribuzione Assegnati i dati relativi al carico di rottura dei pezzi di un lotto in Kg/cm2 riportati nella tabella 6. Tabella 6 623 820 835 544 768 526 791 615 758 752 827 532 573 1016 854 1026 905 834 832 756 481 722 984 915 581 754 702 571 648 873 738 830 865 854 605 608 658 742 955 651 926 758 431 625 792 756 715 576 735 426 621 634 723 776 826 894 873 851 956 584 837 796 637 875 763 432 610 726 656 855 785 682 756 683 691 784 636 682 1072 748 795 936 644 743 1078 605 942 736 890 654 1058 526 782 843 938 970 533 743 856 918 Che hanno: 2 μ = 755 kg/cm media aritmetica 2 scarto quadratico medio σ = 144 kg/cm Politecnico di Bari – Riservato alla circolazione interna 32 Prof. Ing. Michele Marra - Appunti delle Lezioni di Ricerca Operativa - Concetti generali sulla statistica Calcoliamo quale è la percentuale dei dati assegnati che hanno un valore minore o uguale a quello indicato nella tabella 7. Tabella 7 Valore inferiore od uguale a μ -3 μ -2,5 μ -2 μ -1,5 μ μ -0,5 μ μ +0,5 μ + μ +1,5 μ +2 μ +2,5 μ +3 σ = 755 - 3 σ = 755 - 2,5 σ = 755 - 2 σ = 755 - 1,5 σ = 755 - 1 σ = 755 - 0,5 = 755 σ = 755 + 0,5 σ = 755 + 1 σ = 755 + 1,5 σ = 755 + 2 σ = 755 + 2,5 σ = 755 + 3 x 144 = x 144 = x 144 = x 144 = x 144 = x 144 = x 144 = x 144 = x 144 = x 144 = x 144 = x 144 = x 144 = 323 395 467 539 611 683 755 827 899 971 1043 1115 1187 Perc. eff. di dati 0% 0% 3% 8% 18 % 33 % 48 % 69 % 84 % 94 % 97 % 100 % 100 % Kg/cm2 Kg/cm2 Kg/cm2 Kg/cm2 Kg/cm2 Kg/cm2 Kg/cm2 Kg/cm2 Kg/cm2 Kg/cm2 Kg/cm2 Kg/cm2 Kg/cm2 Perc. che risulterebbe se i dati fossero distribuiti normalmente 0,13 % 0,62 % 2,27 % 6,68 % 15,87 % 30,85 % 50,00 % 69,15 % 84,13 % 93,32 % 97,73 % 99,38 % 99,87 % A fianco della colonna della percentuale effettiva di dati in ogni intervallo, sono riportate le percentuali che dovrebbero risultare in ogni intervallo se i carichi di rottura fossero distribuiti normalmente. Dai risultati si può arguire che i carichi di rottura sono distribuiti pressochè normalmente. 2.10. - Teorema del limite centrale Sia f(x) una distribuzione di tipo qualsiasi con media μ e scarto medio σ finiti; se da questa distribuzione di variabile casuale x si estraggono campioni di numerosità n0 al crescere di n la distribuzione delle medie campionarie x approssima una distribuzione gaussiana di media x = μ e scarto quadratico σ x = σ n . Se la distribuzione di origine è gaussiana la distribuzione delle medie campionarie approssima ugualmente la gaussiana anche per n piccolo. Esercizio n. 2.10.1 A titolo esemplificativo si consideri una macchina che produce pezzi con media μ = 10 e σ = 4. Estraendo un campione di 64 pezzi si desideri stimare un intervallo dentro il quale x cada con probabilità del 90%. Per il teorema del limite centrale la variabile casuale x è distribuita con legge gaussiana di media μ e σ x = σ / n . Politecnico di Bari – Riservato alla circolazione interna 33 Prof. Ing. Michele Marra - Appunti delle Lezioni di Ricerca Operativa - Concetti generali sulla statistica Logicamente ci sono tra - ∞ e + ∞ , infiniti intervalli dentro i quali, x può cadere con 90% di probabilità ma è logico, data la forma della curva, prendere per motivi di precisione tra tutti gli intervalli possibili, quello simmetrico rispetto a μ che risulta il più ristretto. Il problema diviene allora quello di trovare x 2 e x 1 = - x 2 in modo che l'area tratteggiata sia pari a 0,9. Si può quindi scrivere: P ( x1 ≤ x ≤ x 2 ) = P( z1 ≤ z ≤ z 2 ) = 0,9 con z = x−μ σ/ n Dalla tabella 3 si ricava facilmente z2 osservando che: z2 1 − 0,9 ∫−∞ f ( z ) dz = 0,9 + 2 = 0,95 Sulla tabella in corrispondenza di 0,95 si legge z2 = 1,65 per cui risulta : x − 10 ≤ 1,65) = 4 / 64 1 1⎞ ⎛ = P⎜10 − 1,65 ⋅ < x < 10 + 1,65 ⋅ ⎟ 2 2⎠ ⎝ P( x1 ≤ x ≤ x 2 ) = P(−1,65 ≤ x x=9,175 1 x=10,825 2 In genere però la media μ dell'universo non è nota e ci si troverà di fronte ad un problema di stima di una serie di intervalli che in una certa percentuale devono includere la media μ - come nel seguente esempio. Esercizio n. 2.10.3 Una macchina produce pezzi con uno scarto quadratico medio σ = 4. Un campione di 64 pezzi ha dato x = 9. Stimare un intervallo di confidenza dello 0,9 per la media μ dei pezzi prodotti dalla macchina. Per la risoluzione del problema basterà risolvere l'espressione: ⎛ ⎞ x−μ ≤ y2 ⎟ = 0,9 P( x1 ≤ x ≤ x 2 ) = P( y1 ≤ y ≤ y2 ) = P ⎜ y1 ≤ ⎜ ⎟ σ ⎝ ⎠ P( y1 ⋅ σ ≤ x − μ ≤ y2 ⋅ σ ) = P( x − y1 ⋅ σ ≥ μ ≥ x − y2 ⋅ σ ) x x x x Dalla tabella 3 si legge in corrispondenza di una probabilità 0,90, y2 = 1,65 si ha quindi y1 = -1,65 e: 4 4 9 + 1,65 ⋅ > μ > 9 − 1,65 ⋅ 64 64 si ottiene: 9,822 μ Politecnico di Bari – Riservato alla circolazione interna 8,175 34 Prof. Ing. Michele Marra - Appunti delle Lezioni di Ricerca Operativa - Concetti generali sulla statistica che è l'intervallo di confidenza del 90%, per la media μ incognita e σ noto, si può ⎛ σ ⎞ determinare una corrispondente serie di intervalli ⎜⎜ x ± 1,65 ⎟⎟ e che circa il 90% di tali n⎠ ⎝ intervalli di confidenza, devono includere la qualntità fissa μ incognita. Esercizio n. 2.10.4 Si abbia il campione: 19,8; 19,9; 19,9; 20,0 estratto da un universo gaussiano dotato di scarto quadratico medio pari a: σ =0,5. Si voglia individuare un intervallo in modo che si abbiano 0,95 probabilità che la media dell'universo cada in quell'intervallo. Si può dire anche che vogliamo individuare per la μ un intervallo di confidenza dello 0,95. La media del campione è: x = 19,9 0,5 e σx = = 0,25 n ⎛ ⎞ x−μ P⎜ y1 < < y2 ⎟ = 0,95 ⎜ ⎟ σ ⎝ ⎠ Dalla tabella 3 si legge in corrispondenza di una probabilità 0,95 y2 = 1,96, quindi y1= 1,96 e: ⎛ ⎞ x−μ < 1,96 ⎟ = 0,95 P⎜ − 1,96 < ⎜ ⎟ σ ⎝ ⎠ 19,9 − 1,96 ⋅ 0,25 < μ < 19,9 + 1,96 ⋅ 0,25 19,41 < μ < 20,39 2.11. - Verifica dell'ipotesi che la media o percentuale abbia un dato valore Estratto un campione di n elementi da una popolazione distribuita normalmente con media μ ignota e s. q. m. noto, si vuole verificare se, sulla scorta delle risultanze campionarie, è valida l'ipotesi che la media incognita della popolazione sia uguale ad uno specifico valore μ 0 . Ora, se l'ipotesi è vera, x sarà distribuito normalmente attorno a μ 0 e con s. q. m. vale a dire che la variabile standardizzata y0 = σ n , x − μ0 è distribuita normalmente con σ/ n media ε =0 e s. q. m. = 1 se l'ipotesi è vera. Politecnico di Bari – Riservato alla circolazione interna 35 Prof. Ing. Michele Marra - Appunti delle Lezioni di Ricerca Operativa - Concetti generali sulla statistica Verifichiamo l'ipotesi μ = μ 0 con un livello di significatività del 5% cioè scegliamo come limite |y| = 1,96 (vedi tab. 3). Decidiamo di rifiutare l'ipotesi se |y0| > 1,96. L'accettiamo se |y0| < 1,96. Esercizio n. 2.11.1 1) in un'indagine sulla spesa media per il servizio trasporto dei cittadini di una città, effettuata su di un campione di 200 persone, è risultata una media di £. 152 al giorno. Si vuol verificare l'ipotesi che μ = 150, cioè che la spesa media giornaliera della popolazione sia di 150 lire fissando un livello di significatività del 5% e conoscendo lo scarto quadratico medio σ pari a 20. Allora: y0 = x − μ0 σ/ n = 152 − 150 = 1,41 20 200 Siccome y0 = 1,41 è compreso nell'intervallo da -1,96 a +1,96 l'ipotesi è accettata. 2) da un'altra inchiesta sulla percentuale delle famiglie di una città che consuma cioccolato in polvere, effettuata su di un campione di 100 famiglie, è risultata una percentuale del 12%. Si vuole verificare l'ipotesi che la percentuale della popolazione che consuma cioccolato in polvere sia del 7% (cioè ρ = 0,07), fissato al 5% la probabilità di errore. ρ'−ρ 0 0,12 − 0,07 = = +1,959 y= 0,07(1 − 0,07) ρ 0 (1 − ρ 0 ) 100 n Siccome y =+1,959 è compreso nell'intervallo da -1,96 a 1,96 l'ipotesi andrebbe accettata anche se ai limiti. Esercizio n. 2.11.2 Al fine di stimare la produzione unitaria media giornaliera per operaio in una azienda si prese un campione di 64 rilievi storici. La media risultò di 136 unità. Dalla esperienza passata lo scarto quadratico medio risultava di 25 unità. 1) Determinare l'intervallo corrispondente ad un livello di confidenza del 95%. 25 Si ha: n=64 σ =25 x =136 σ = = 3,125 x 64 136 − μ ⎛ ⎞ P⎜ − 1,96 < < 1,96 ⎟ = 0,95 3,125 ⎝ ⎠ P(136 − 1,96x3,125 < μ < 136 + 1,96x 3,125) = 095 P(129,875 < μ < 142,125) = 0,95 L'intervallo cercato ha perciò i due estremi 129,875 e 142,125. 2) L'ipotesi x = 140 unità (l'ipotesi alternativa essendo x ≠ 140 ) è accettabile ad un livello di significatività del 5%? Politecnico di Bari – Riservato alla circolazione interna 36 Prof. Ing. Michele Marra - Appunti delle Lezioni di Ricerca Operativa - Concetti generali sulla statistica Se l'ipotesi nulla x = 140 è vera, il 95% delle medie campionarie dovrebbe cadere entro l'intervallo che ha per estremi (140-1,96x3,125) = 133,875 e (140+1,96x3,125)=146,125. La media ottenuta dall'esperimento effettuato pari a 136, cade entro tale intervallo. Si accetta perciò l'ipotesi nulla formulata ( x = 140 ). 3) quanto grande si deve prendere il campione affinchè ci si possa aspettare che, con un intervallo di confidenza del 99%, la media dell'universo sia compresa entro 5 unità della media del campione. Il valore normalizzato y che lascia fuori l'1% dell'area della curva normale risulta, dalle tavole, pari a 2,57 corrispondente all'area differenza di A(0,9950) - A(0,005) per cui si può porre: x −μ ≤ 5 − 2,57 < con x −μ < 2,57 σ n − 2,57 da cui: n 2,57 e quindi: da cui, essendo < x −μ < 2,57 n <5 n σ =25 n > 165,12, ovvero n> 165 Esercizio n. 2.11.3 Quante volte bisogna lanciare una moneta perché si abbia una probabilità del 90% che la percentuale di teste uuscite sia tra 0,4 e 0,6. Lanciare una moneta vuol dire avere o testa o croce. P(0,4 < x <0,6) = 0,9 μ = ρ = 0,5 x −μ <y2) = 0,9 σ y1 = -1,65 0,5 0,5 ⎛ ⎞ P⎜ − 1,65 ⋅ + 0,5 < x < 1,65 ⋅ + 0,5 ⎟ = 0,9 n n ⎝ ⎠ 0,5 0,4 ? 0,5 − 1,65 ⋅ da cui n = 68 n P(y1< Esercizio n. 2.11.4 Un ricercatore deve valutare la media di una popolazione usando un campione abbastanza numeroso da avere lo 0,95 di probabilità che la media del campione non si scosti da quella della popolazione di più del ± 25% dello scarto quadratico medio σ Politecnico di Bari – Riservato alla circolazione interna 37 Prof. Ing. Michele Marra - Appunti delle Lezioni di Ricerca Operativa - Concetti generali sulla statistica ) ( P μ − 0,25 σ < x < μ + 0,25 σ = 0,95 P( y1 < x −μ < y 2 ) = 0,95 σ x y1 = -1,95 ( y2 = 1,95 P μ − 1,95 σ < x < μ + 1,95 σ x Si ha: 0,25 σ =1,95 σ σ x ) da cui σ = x x 0,25 1,95 2 1,95 1,95 ⎛ 1,95 ⎞ n= n=⎜ ⎟ = 61 0,25 0,25 n ⎝ 0,25 ⎠ Tale valore di n assicura con 95% di probabilità che la media del campione non si scosti di più del ± 25% dello scarto quadratico medio σ . Si abbia il campione: 19,8 19,9 19,9 con σ = 0,5 20,0 vogliamo individuare un intervallo in modo che si abbiano 0,95 probabilità che la media dell'universo cada in quell'intervallo. Si dice brevemente che vogliamo individuare un intervallo di confidenza dello 0,95. Media del campione x =19,9 0,5 σx = = 0,25 n =4 n = σ⋅ ⎛ ⎞ x −μ P⎜ y1 < < y 2 ⎟ = 0,95 ⎜ ⎟ σx ⎝ ⎠ P(− 1,95 ⋅ 0,25 + 19,9 < μ < 19,9 + 1,95 ⋅ 0,25) = 0,95 P(19,4125< μ <20,3875)=0,95 Esercizio n. 2.11.5 Un'agenzia desidera interrogare un campione di aventi diritto al voto in un certo stato prendendolo abbastanza grande da avere l'1% di probabilità di trovare che la % favorevole ed un candidato è minore del 50% quando in effetti è del 52%. μ = ρ = 0,52 σ = x ρq 0,52 ⋅ 0,48 = n n P( x < 0,50) = 0,01 ⎡x −ρ ⎤ P⎢ < y 2 ⎥ = 0,01 ⎢ σ ⎥ ⎣ x ⎦ è il valore corrispondente all'area 0,99 Politecnico di Bari – Riservato alla circolazione interna 38 Prof. Ing. Michele Marra - Appunti delle Lezioni di Ricerca Operativa - Concetti generali sulla statistica P⎛⎜ x < σ ⋅ y 2 + ρ ⎞⎟ x ⎝ ⎠ y 2 = −2,57 0,50 = σ ⋅ y 2 + ρ = x 0,52 ⋅ 0,48 ⋅ y2 + ρ n da cui si ricava 0,50 = − 0,52 ⋅ 0,48 ⋅ 2,57 + 0,5 n 0,50 = 0,52 − 2,57 0,52 ⋅ 0,48 n da cui si ricava n ≅ 3300 n ≅ 4121 Esercizio n. 2.11.6 Intervallo di confidenza per la media. In uno studio di tempi e movimenti si è interessati a stimare il tempo medio che impiega una segreteria per compilare un certo modulo. Un esperimento condotto su 40 impiegate ha fornito i seguenti risultati: media x = 52,2 sec.; σ = 8,52 sec. Supposto di poter approssimare la σ dell'universo con la σ del campione, determinare per la media un'intervallo di confidenza dello 0,9. σ = 8,52 sec. ⎞ ⎛ x −μ ⎜ P y1 < < y 2 ⎟ = 0,9 ⎟ ⎜ σ x ⎠ ⎝ x =52,2 y 1 = −1,65 p⎛⎜ x − σ ⋅ y 2 < μ < x − σ ⋅ y 1 ⎞⎟ = 0,9 x x ⎠ ⎝ 8,52 σ = y 2 = 1,65 x 40 ,52 ,52 < μ < 52,2 + 1,65 ⋅ 52,2 − 1,65 ⋅ 40 40 49,8 < μ < 54,42 Esercizio n. 2.11.7 Supponendo che le misure di un pezzo, prodotto da una certa macchina siano distribuite secondo una curva di Gauss con μ =10 e σ = 2. 10 Si calcoli (sapendo che le tolleranze del disegno del pezzo sono 10 + 0,5 0,3) la percentuale di pezzi difettosi che ci si può aspettare dalla produzione eseguita con la macchina in questione. Politecnico di Bari – Riservato alla circolazione interna 39 Prof. Ing. Michele Marra - Appunti delle Lezioni di Ricerca Operativa - Concetti generali sulla statistica Soluzione: I pezzi sono difettosi quando hanno dimensione oltre le tolleranze: L'area a tratti dà la percentuale di pezzi difettosi. Si ha dunque: 10,5 − 10 ⎞ ⎛ 9,7 − 10 ρ = 1 − P(9,7 ≤ x ≤ 10,5) = 1 − P⎜ ≤y≤ ⎟ 2 ⎝ 2 ⎠ 0 , 25 ⎤ ⎡0,15 = 1 − ⎢ ∫ f (z)dz − 0,5 + ∫ f (z)dz − 0,5⎥ = 1 − (0,8896 − 0,5 + 0,6026 − 0,5) = 0,8378 −∞ ⎦ ⎣ −∞ Esercizio n. 2.11.8 La vita media di una resistenza elettrica è di 1200 ore e lo scarto quadratico medio è di 200 ore. Essendo disposti a tollerare fino a 400 ore in meno nella durata e supponendo gaussiana la distribuzione delle durate, che percentuale di pezzi difettosi ci si può aspettare? Soluzione: L'area a tratti dà la percentuale di pezzi difettosi. 800 − 1.200 ⎞ ⎛ ρ = P(d ≤ 800) = P⎜ y ≤ ⎟ 200 ⎝ ⎠ P= −2 2 −∞ −∞ ∫ f (z)dz = 1 − ∫ f (z)dz = 1 − 0,9772 P = 0,02228 Politecnico di Bari – Riservato alla circolazione interna 40 Prof. Ing. Michele Marra - Appunti delle Lezioni di Ricerca Operativa - Concetti generali sulla statistica Nelle condizioni dell'esercizio precedente, quale percentuale di media campionaria ci si può attendere entro l'intervallo da 1.160 a 1.240, supponendo di prendere campioni di 100 pezzi? Soluzione: ⎛ ⎞ ⎜ ⎟ 1.160 − 1.200 1.240 − 1.200 ⎟ ⎜ ⎛ ⎞ ρ = P⎜1.160 ≤ x ≤ 1.240 ⎟ = P ≤y≤ ⎜ ⎟ ⎝ ⎠ 200 200 ⎜ ⎟ 100 100 ⎝ ⎠ ⎛ +2 ⎞ ⎜1 − ∫ f (z)dz ⎟ = 1,9544 − 1 = 0,9544 − f ( z ) dz ∫−∞ ⎜ ⎟ ⎝ −∞ ⎠ 2 = Esercizio n. 2.11.9 La vita media di una resistenza elettrica è di 1200 ore con σ = 200 ore. Modificata la produzione, un campione di 100 pezzi ha fornito una media di 1.250 ore. Verificare l'ipotesi nulla μ = 1.200 contro l'alternativa μ ≠ 1.200 assumendo un livello di significatività dello 2,5%. Soluzione: ⎛ ⎞ ⎜ ⎟ x −μ ⎜ < y 2 ⎟ = 0,975 P y1 < ⎜ ⎟ σ ⎜ ⎟ n ⎝ ⎠ μ = 1.200 x = 1.250 Dovendo verificare l'ipotesi nulla con un livello di significatività del 2,5% (con un livello di confidenza dello 0,975) si ottiene: y 1 = − y 2 = 2,24 x − μ 1.250 − 1.200 50 = = = 2,5 σ 200 20 n 100 2,5 non è compreso nell'intervallo - 2,24; + 2,24 per cui l'ipotesi è senz'altro da scartare. Politecnico di Bari – Riservato alla circolazione interna 41 Prof. Ing. Michele Marra - Appunti delle Lezioni di Ricerca Operativa - Concetti generali sulla statistica Esercizio n. 2.11.10 Un'azienda ha fatto un'indagine di mercato per conoscere la percentuale di consumatori che preferiscono la sua marca di prodotti. Su un campione di 250 consumatori, 60 hanno risposto di preferire la marca dell'azienda. a) costruire l'intervallo di confidenza del 90% della percentuale vera di consumatori che preferiscono la marca. b) Verificare l'ipotesi ρ = 30% contro l'alternativa ρ ≠ 30% assumendo un valore di significatività pari al 5%. Risultarono preferire la marca desiderata 96 persone. c) Può essere accettata l'ipotesi di eguale frequenza per la marca nelle due zone? Si assuma un livello di confidenza del 95%. a) si accetta σ= 60 190 ⋅ 250 250 σ = x 60 190 ⋅ 60 ⋅ 90 250 250 = 250 3 250 ⎛ ⎞ 60 ⎜ ⎟ −μ ⎜ ⎟ 250 < y 2 ⎟ = 0,90 determina l'intervallo cercato La P⎜ y 1 < 60 ⋅ 90 ⎜⎜ ⎟⎟ 250 3 ⎝ ⎠ ⎛ ⎞ 60 30 ⎜ ⎟ − ⎜ ⎟ 250 100 < y 2 ⎟ = 0,95 b) P⎜ y 1 < 60 ⋅ 90 ⎜⎜ ⎟⎟ 250 3 ⎝ ⎠ 30 60 ⋅190 30 60 ⋅190 60 se , + y1 + y2 cade nell'intervallo 3 100 100 250 250 250 3 si accetta l'ipotesi ρ = 30% ( ) c) consideriamo la variabile casuale δ = x 1 − x 2 di μ = 0 60 190 90 204 ⋅ ⋅ 250 250 300 300 = 1,45 ⋅10 − 3 2 2 2 + e σ 1, 2 = σ x + σ x = 1 2 250 300 σ 1, 2 = 0,038 ove x 1 e x 2 sono rispettivamente le medie campionarie per n1 = 250 n2 = 300. L'ipotesi di eguale preferenza è accettata se ∂ = 0 cade nell'intervallo individuato dalla: Politecnico di Bari – Riservato alla circolazione interna 42 Prof. Ing. Michele Marra - Appunti delle Lezioni di Ricerca Operativa - Concetti generali sulla statistica ⎞ ⎛ δ−0 P⎜ y 1 < < y 2 ⎟ = 0,95 ⎟ ⎜ σ 1, 2 ⎠ ⎝ 60 96 δ= − = 0,24 − 0,32 = −0,08 250 300 y 1 σ 1, 2 < δ < y 2 σ 1, 2 ; −1,95 ⋅ 0,038 < −0,08 < 1,95 ⋅ 0,038 − 0,074 < −0,08 < 0,074 l'ipotesi non è accettabile, essendo -0,08 < - 0,074. CAPITOLO II 2.1 - CONCETTI GENERALI SULLA STATISTICA……………….13 2.1.1. - Statistica descrittiva………………………………………………………....13 2.2. - Rappresentazione qrafìca di una distribuzione di frequenza…………………14 2.3. - Caratteristiche fondamentali di una distribuzione di frequenza……………..16 2.3.1. - Tendenza centrale……………………………………………………………16 2.3.2. – Dispersione…………………………………………………………………..17 2.4. - Variabile casuale discreta……………………………………………………..18 2.5. - Distribuzione binomiale o di Bernoulli……………………………………...19 2.5.1. - Esempi di applicazione della distribuzione binomiale …………………….21 2.6. - Distribuzione di Poisson……………………………………………………….23 2.6.1. Esercizio di confronto tra binomiale e poissoniana………………………….24 2.7. - Variabile casuale continua……………………………………………………25 2.8. - Valor medio di una variabile casuale………………………………………....26 Politecnico di Bari – Riservato alla circolazione interna 42 Prof. Ing. Michele Marra - Appunti delle Lezioni di Ricerca Operativa - Concetti generali sulla statistica 2.9. - Distribuzione di Gauss………………………………………………………………27 2.10. - Teorema del limite centrale………………………………………………………...32 2.11. - Verifica dell'ipotesi che la media o percentuale abbia un dato valore……………34 Bibliografia A. M. Mood, F.A. Graybill, Introduction to the theory of Statistic, McGraw-Hill Book Company, New York, 1963. G. Togliatti, Elementi di Statistica, Clup Cooperativa libraria universitaria del Politecnico di Milano,1973. J. R. Benjamin, C. A. Cornell, Probability, Statistics and Decision for Civil Engineers, McGraw-Hill Book Company, New York, 1970. M. R. Spiegel, Theory and Problems of Statistics, Schaum Publishing Co., New York, 1961. E. B. Haugen, Probabilistic Approach to Design, J. Wiley & Sons, London, 1968. Politecnico di Bari – Riservato alla circolazione interna 43