19/09/2014 Richiami Statistica Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Università degli Studi di Cagliari D.I.M.C.M. Richiami Statistica Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Dati grezzi, serie di dati e campo di variazione o Dati grezzi: dati raccolti non ordinati. Esempio: temperature registrate giornalmente in una certa località. o Serie: ordinamento di dati numerici grezzi in ordine crescente o decrescente. o Campo di variazione dei dati: differenza fra il numero più grande e quello più piccolo. Richiami di statistica Prof. Ing. Maria Teresa Pilloni 2 Richiami Statistica Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Frequenza di una classe – Distribuzione di frequenza Richiami Statistica Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Limiti di una classe – Ampiezza – Valore centrale o “Limiti della classe”: ‘estremi’ della classe. o Ampiezza della classe: differenza fra il confine inferiore e il confine superiore. Gli intervalli possono o meno avere tutti la stessa ampiezza. o Valore centrale di una classe: semisomma dei limiti inferiore e superiore della classe. o I dati grezzi vengono distribuiti in classi. o Frequenza della classe: numero di individui appartenenti a ciascuna classe. o Distribuzione di frequenze: ordinamento tabulare che riporti le singole classi di dati e, in corrispondenza, le relative frequenze di ogni classe. 3 4 1 19/09/2014 Richiami Statistica Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Richiami Statistica Passi per costruire una distribuzione di frequenza Istogrammi 1. Determinare il più grande e il più piccolo fra i dati grezzi, e trovare quindi il campo di variazione; 2. Dividere il campo di variazione in un numero conveniente di classi della stessa ampiezza (numero generalmente compreso fra 5 e 20); 3. Determinare il numero di osservazioni che ricadono all’interno di ciascuna classe ⇒ la frequenza delle classi. Istogramma: grafico costituito da rettangoli con base sull’asse orizzontale, centro sul valore centrale della classe, lunghezza pari all’ampiezza della classe, area proporzionale alla frequenza della classe. Classi di uguale ampiezza ⇒ altezza dei rettangoli proporzionale alla frequenza delle classi. 5 Richiami Statistica Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 6 Richiami Statistica Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Frequenza relativa – Distribuzione di frequenze relative Poligoni di frequenza o Frequenza relativa di una classe: frequenza della classe/totale delle frequenza di tutte le classi; é espressa come percentuale. o “Distribuzione di frequenze relative”: si ottiene sostituendo le frequenze di ciascuna classe con le corrispondenti frequenze relative; o Frequenza cumulativa: frequenza totale di tutti i valori inferiori al confine superiore di una data classe (include anche la classe considerata). Poligono di frequenza: grafico lineare delle frequenze delle classi passante per i valori centrali delle classi. Può essere ottenuto unendo i punti di mezzo dei lati superiori dei rettangoli di un istogramma. 7 8 2 19/09/2014 Richiami Statistica Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Richiami Statistica Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Ogiva – Frequenze relative cumulative – Curve di frequenza 1. “Poligono delle frequenze cumulate”, o “ogiva”: grafico che riporta la frequenza cumulata passando per i confini superiori delle classi. 2. Frequenze cumulate relative o frequenze cumulate percentuali: frequenze cumulate divise per le frequenze totali. 3. Riducendo l’ampiezza delle classi, si hanno segmenti piccoli che possono approssimare delle curve: si parla allora di curve di frequenza e di curve di frequenza relativa. 9 Richiami Statistica Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 11 10 Richiami Statistica Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 12 3 19/09/2014 Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Richiami Statistica Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Richiami Statistica Media di una distribuzione 1. La media è un valore rappresentativo di un insieme di dati. 2. Si possono definire diversi tipi di medie: a) b) c) d) e) 13 13 Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Richiami Statistica Media aritmetica x ∑ x= N j Media aritmetica Mediana Moda Media geometrica Media armonica 14 Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Richiami Statistica Media aritmetica ponderata f ∑ x= j Media aritmetica: se ai numeri x1, … , xj sono associabili dei pesi w1, … , wj, che ne definiscono l’importanza, allora la media ponderata vale: xj wx ∑ x= ∑w N j fj : frequenze con cui compaiono le xj j j 15 16 4 19/09/2014 Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Richiami Statistica Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Richiami Statistica Media aritmetica: proprietà a) Somma algebrica delle differenze tra un insieme di numeri e la loro media aritmetica vale zero. b) Somma dei quadrati delle differenze fra un insieme di numeri Xj e un qualsiasi numero a è minima se e solo se a=media aritmetica. c) Se f1 numeri hanno media m1, f2 numeri hanno media m2, .... , fK numeri hanno media mK, la media di tutti i numeri è una media aritmetica ponderata di tutte le medie. 17 18 Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Richiami Statistica Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Richiami Statistica Mediana Mediana La mediana di un insieme di numeri ordinati è il valore centrale oppure la media aritmetica dei due valori centrali. 1. PdV geometrico: è il valore di ascissa corrispondente alla linea verticale che divide un istogramma in due parti di uguale area. Esempio 1: l’insieme di numeri: 3, 4, 4, 5, 6, 8, 8, 8, 10 ha mediana 6. Esempio 2: l’insieme di numeri: 5, 5, 7, 9, 11, 12, 15, 18 ha mediana (9+11)/2=10. 19 20 5 19/09/2014 Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Richiami Statistica Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Richiami Statistica La mediana Mediana 2. E’ sostituita alla media aritmetica se: Esempio: in tabella sono riportati i dati di costo di una certa operazione industriale: • • • i dati sperimentali sono pochi i dati sono ammassati verso un estremo esiste il rischio di valori anomali o aberranti In tali casi la media aritmetica non è rappresentativa, essendo fortemente influenzata, all’opposto della mediana, dai valori estremi. COSTI fi 24 4.08 2.16 1.68 1.44 .96 .6 1 1 1 1 3 2 4 22 21 Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Richiami Statistica Mediana Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Richiami Statistica Mediana Media aritmetica: 3.12, ma ben 11 dei 13 dati del campione sono al di sotto di 3.12! Nel nostro caso basta togliere il primo dato (24) per far crollare la media da 3.12 a 1. ⇒ la media aritmetica, non è sempre la misura più rappresentativa della tendenza centrale: le manca la proprietà di essere resistente ai cambi!! La mediana invece ha la proprietà di essere resistente ai cambi. La statistica non è resistente se, cambiando pochi dati del campione, il valore della grandezza viene alterato in modo sostanziale. 23 Nel nostro caso, la mediana coincide con il dato al settimo posto, (i dati sono ordinati), cioè 1.44. 24 6 19/09/2014 Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Richiami Statistica Mediana Moda Moda: è il valore che si presenta con la più alta frequenza, cioè il valore più comune. Anche togliendo il valore estremo, 24, la mediana scenderebbe alla semisomma dei valori in 6A e 7A posizione, cioè (1.44+0.96)/2=1.2, restando quindi ampiamente rappresentativa della tendenza centrale del campione in esame. La moda può non esistere, e, anche se esiste, può non essere unica. 26 25 Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Richiami Statistica Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Richiami Statistica Richiami Statistica Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Moda Esempio 1 : l’insieme di numeri 2, 2, 5, 7, 9, 9, 9, 10, 10, 11, 12, 18 ha moda 9. Esempio 2 : l’insieme di numeri: 3, 5, 8, 10, 12, 15, 16 non ha moda. Esempio 3 : l’insieme di numeri: 2, 3, 4, 4, 4, 5, 5, 7, 7, 7, 9 ha due mode, che sono 4 e 7, ed è detto bimodale. Distribuzione con una moda: unimodale. 27 28 7 19/09/2014 Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Richiami Statistica Media geometrica G Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Richiami Statistica Media armonica H Media geometrica G di un insieme di N numeri X1, X2, ... , XN: radice ennesima del prodotto dei numeri: Media armonica H di un insieme di N numeri X1, X2, ... , XN : reciproco della media aritmetica dei reciproci dei numeri stessi: 1 1 H= G = x1 * x2 * ....... * xN N N ∑ j =1 N = 1 xj N 1 ∑x j 29 Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Richiami Statistica X2 = Richiami Statistica Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Misure di dispersione di una distribuzione Media quadratica ∑ xj 30 Dispersione o variazione dei dati: attitudine di certi dati numerici a disporsi attorno ad un valore medio. 2 Esistono tre sistemi per misurare la dispersione: N a) Campo di variazione b) Scostamento semplice medio assoluto dalla media aritmetica c) Scarto quadratico medio 31 32 8 19/09/2014 Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Richiami Statistica Misure di dispersione: il campo di variazione. Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Richiami Statistica Misure di dispersione: scostamento medio assoluto. Campo di variazione: differenza fra il più grande e il più piccolo dei numeri. Cresce con la numerosità dei campioni ⇒ il suo uso è giustificato solo per campioni di numerosità ridotta e in assenza di dati anomali. E’ definito da: ∑ N j =1 xj − x N Nel settore del controllo di qualità è largamente usato come misura della variabilità del prodotto al posto della varianza o della deviazione standard. 33 Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Richiami Statistica Misure di dispersione: scarto quadratico medio E’ definito da: ∑ (x N σ= j =1 j −x ) 34 Richiami Statistica Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Misure di dispersione: varianza. La varianza di un insieme di dati è definita come il quadrato dello scarto quadratico medio (σ2). 2 N −1 N-1 al denominatore ⇒ deve essere N>1 per poter valutare la dispersione. 35 La varianza di una popolazione è solitamente indicata con σ2; la varianza di un insieme di dati tratto dalla popolazione (varianza campionaria) è spesso indicata come s2. 36 9 19/09/2014 Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Richiami Statistica Proprietà dello scarto quadratico medio Proprietà dello scarto quadratico medio 1. Lo scarto quadratico medio può essere definito nella forma: ∑ (x N σ= j =1 − a) 2 j Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Richiami Statistica 1. Di tutti gli scarti quadratici medi, il più piccolo è quello per cui a=media aritmetica; per questa ragione lo scarto quadratico medio viene solitamente definito come prima. N −1 ∑ (x N a: media qualunque (non necessariamente la media aritmetica). σ= j =1 − a) 2 j N −1 37 Richiami Statistica Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Proprietà dello scarto quadratico medio 2. Se x ha una distribuzione normale con media µ e varianza σ2, si può dimostrare che: a) il 68.27% dei casi è compreso fra -σ e +σ b) il 95.45% dei casi è compreso fra -2σ e +2σ c) il 99.73% dei casi è compreso fra -3σ e +3σ Per distribuzioni moderatamente asimmetriche, si può ancora ricorrere, con buona approssimazione, alle precedenti tre percentuali. 39 38 Richiami Statistica Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Teoria elementare della probabilità: definizione classica Probabilità che un dato evento si verifichi: rapporto fra il numero di casi favorevoli e il numero di casi possibili, purché essi siano tutti ugualmente possibili. Si tratta chiaramente di una definizione a priori. 40 10 19/09/2014 Richiami Statistica Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Teoria elementare della probabilità: definizione classica Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Richiami Statistica Teoria elementare della probabilità p = prob{E} = Se: E=evento h=numero casi favorevoli n=numero casi possibili h n La probabilità q che l’evento E non si verifichi (insuccesso) è data da: n−h q = prob non E = = 1 − p = 1 − prob{E} n Allora la probabilità p che l’evento E si verifichi (successo) è data da: 41 Richiami Statistica Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Teoria elementare della probabilità 42 Richiami Statistica Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Definizione di probabilità tramite la frequenza relativa 0<p<1 sempre La definizione classica cade in difetto quando i casi che si possono ritenere ugualmente possibili non sono numerabili. Se un evento non può presentarsi la sua probabilità è 0. Si ricorre allora alla definizione di probabilità stimata, che è una definizione “a posteriori”. Se l’evento è certo la sua probabilità è 1. 43 44 11 19/09/2014 Richiami Statistica Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Definizione di probabilità tramite la frequenza relativa Richiami Statistica Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Definizione di probabilità tramite la frequenza relativa Probabilità stimata, o empirica: è data dalla frequenza relativa del presentarsi dell’evento quando il numero delle osservazioni è molto grande. Esempio: Se su 1000 lanci della moneta si ottiene “testa” 529 volte, la frequenza relativa della opzione “testa” è 529/1000=0.529; se in altri 1000 lanci esce “testa” 493 volte, la frequenza relativa sul totale dei 2000 lanci è (529+493)/2000=0.511. La probabilità è il limite della frequenza relativa quando il numero delle osservazioni cresce indefinitamente. Continuando così ci si avvicina sempre più al numero definito come probabilità in senso statistico. 45 Richiami Statistica Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 46 Richiami Statistica Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Probabilità condizionata Probabilità condizionata E1, E2 eventi Se il presentarsi o il non presentarsi di E1 non influisce sulla probabilità di presentarsi di E2, allora PrE2/E1 o PrE2 dato E1 : probabilità che, presentatosi E1 si presenti E2 PrE2/E1= PrE2 PrE2/E1 o PrE2 dato E1: probabilità condizionata di E2, posto che E1 si sia presentato e si dice che E1 ed E2 sono eventi indipendenti; in caso contrario, si parla di eventi dipendenti. 47 48 12 19/09/2014 Richiami Statistica Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Probabilità condizionata Richiami Statistica Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Probabilità condizionata Se si indica con E1E2 l’evento che si presentino sia E1 sia E2, detto talvolta evento composto, si ha allora che Se gli eventi E1 ed E2 sono indipendenti allora: Pr{E1 E2 } = Pr{E1 }Pr{E2 } Pr{E1 E2 } = Pr{E1 }Pr{E2 / E1 } 49 Richiami Statistica Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Probabilità che almeno un evento di verifichi 50 Richiami Statistica Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Probabilità che almeno un evento di verifichi Si dice che due o più eventi si escludono a vicenda se il presentarsi di uno di essi esclude il presentarsi degli altri. Se E1 ed E2 sono eventi che si escludono a vicenda, Pr(E1E2)=0. Se E1+E2 indica l’evento che dei due eventi E1 ed E2 “si presentino o l’uno, o l’altro o entrambi”, allora 51 Pr{E1 + E2 } = Pr{E1 }+ Pr{E2 }− Pr{E1 E2 } Se gli eventi si escludono a vicenda: Pr{E1 + E2 } = Pr{E1}+ Pr{E2 } 52 13 19/09/2014 Richiami Statistica Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Richiami Statistica Teoria elementare della probabilità Probabilità che almeno un evento di verifichi Esempio: estrazione di un asso e di una carta di cuori: 4/52+12/52, cui devo sottrarre la probabilità di estrarre un asso di cuori, per evitare di mettere in conto due volte la stessa cosa…. Ecco il perché del segno meno …… Se una variabile X può assumere un insieme discreto di valori X1, X2, ... , XK con probabilità p1, p2, ... , pK, (con p1+p2+...+pK=1), ⇒ è stata definita per X una distribuzione di probabilità discreta. Funzione di probabilità di X: funzione p(X) che assume i valori p1, p2, ... , pK rispettivamente in corrispondenza di X1, X2, ... , XK. X è una variabile casuale (o stocastica) discreta. 53 Richiami Statistica Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 54 Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Richiami Statistica Distribuzione binomiale Teoria elementare della probabilità Quanto detto vale anche se X è continua; in tal caso il poligono delle frequenze relative diventa, al limite, una curva continua p(X)=f(X). Distribuzione continua di probabilità = distribuzione di densità di probabilità; essa è tale che f(x)dx fornisce la probabilità che la variabile casuale sia compresa fra x e x+dx. (il termine “densità” è riservato alle distribuzioni continue). 55 p: probabilità del successo q=1-p: probabilità di insuccesso Probabilità che l’evento si presenti esattamente X volte in N prove (⇒ la probabilità che si abbiano X successi ed N-X insuccessi) è data da: p ( x) = N! p X qN−X X !( N − X )! 56 14 19/09/2014 Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Richiami Statistica Distribuzione binomiale Richiami Statistica Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Distribuzione binomiale Esempio: probabilità che si presentino esattamente 2 teste in 6 lanci di una moneta non truccata: N! p X qN−X = X !( N − X )! 6! 5 p( 2) = 0.52 0.56− 2 = 2!(6 − 2)! 24 p( x) = Distribuzione di probabilità binomiale: è una distribuzione discreta e presenta le seguenti proprietà: Media µ=Np Varianza σ2=Npq Scarto quadratico medio σ=√Npq 57 Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Richiami Statistica Y= 1 e σ 2π Richiami Statistica Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Distribuzione Normale Distribuzione normale (di Gauss) 1 ( x − µ )2 − 2 σ 2 58 L’area delimitata dalla curva e dall’asse delle X vale 1 (ciò vale per tutte le distribuzioni di probabilità). L’area sotto la curva compresa fra le due ordinate corrispondenti a X=a e X=b, con a<b, rappresenta la probabilità che X sia compreso fra a e b: Pa<X<b. µ: media σ: scarto quadratico medio. 59 60 15 19/09/2014 Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Richiami Statistica Distribuzione normale La variabile standardizzata La variabile standardizzata adimensionale definita come: Distribuzione di probabilità normale: è una distribuzione continua e presenta le seguenti proprietà: z= Media = µ Varianza = σ2 Scarto quadratico medio = σ 61 Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Richiami Statistica Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Richiami Statistica Distribuzione Normale è una quantità x−µ σ Z misura le deviazioni dalla media rispetto allo scarto quadratico medio; ciò è molto utile nel confronto fra distribuzioni. 62 Richiami Statistica Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Distribuzione Normale Se la variabile X è espressa in termini di unità standard, z=(X-µ)/σ, l’equazione data viene sostituita dalla sua forma standardizzata: 1 1 − 2 z2 Y= e 2π In tal caso z è distribuita normalmente con media zero e varianza uno. 63 64 16 19/09/2014 Richiami Statistica Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Richiami Statistica Distribuzione Normale Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Distribuzione Normale 66 65 Richiami Statistica Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Richiami Statistica Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Intervalli di confidenza (intervalli fiduciari) Distribuzione Normale Se X ha distribuzione normale, si può dimostrare che: il 68.27% dei casi è compreso fra -σ e +σ il 95.45% dei casi è compreso fra -2σ e +2σ il 99.73% dei casi è compreso fra -3σ e +3σ Tali intervalli sono gli intervalli di confidenza e i loro estremi sono detti limiti di confidenza o limiti fiduciari al 68.27%, al 95.45%, al 99.73%. 67 68 17 19/09/2014 Richiami Statistica Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Richiami Statistica Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Intervalli di confidenza (intervalli fiduciari) Intervalli di confidenza (intervalli fiduciari) Si definisce ”intervallo di fiducia” per il parametro θ, un intervallo entro il quale il parametro assume i valori con una prefissata probabilità, chiamata “livello di fiducia”. In generale, i limiti di confidenza della media della popolazione sono dati da: M m Z cσ M e σ: media e scarto quadratico medio di una generica popolazione 70 69 Richiami Statistica Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Intervalli di confidenza (intervalli fiduciari) ZC : Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Teoria del campione I concetti sopra esposti derivano dalla Teoria del campione, che consente di ottenere un risultato dall’esame di un campione, ricavato dall’universo, e di valutare la fiducia che esso (e quindi anche i risultati che se ne ottengono) merita in quanto rappresentativo dell’universo stesso. Livello di confidenza o livello di fiducia Livello di fiducia [%] 68.27 95 95.45 99 99.73 Richiami Statistica ZC 1 1.96 2 2.58 3 71 72 18 19/09/2014 Richiami Statistica Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Richiami Statistica Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Teoria del campione Teoria del campione (Teorema del limite centrale) Qualunque sia la distribuzione della variabile casuale x dell’universo, purché la media e la varianza della popolazione siano finiti, la distribuzione della variabile casuale, cioè la distribuzione delle medie x di diversi campioni tutti della stessa numerosità e tratti a caso dall’universo, è approssimativamente normale. Quindi, se da una popolazione si traggono tutti i campioni possibili, costituiti da un numero sufficiente N (N>50) di dati, le medie dei campioni tendono a distribuirsi normalmente. 73 Richiami Statistica Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Teoria del campione σ x = Richiami Statistica Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Teoria del campione La media di tutte le medie dei singoli campioni è uguale alla media dell’universo, mentre la varianza della distribuzione delle medie dei singoli campioni vale 2 74 σ u2 Se si dovesse operare su molti campioni il lavoro diventerebbe pesante. Ma le tecniche statistiche consentono di ricavare, con una approssimazione definibile a priori, le caratteristiche dell’universo operando su un solo campione. n Con: σ2u varianza dell’universo n: numero dati ciascun campione. 75 76 19 19/09/2014 Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Richiami Statistica Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Richiami Statistica Teoria del campione Teoria del campione Ciò è possibile per il fatto che ogni singolo campione riproduce approssimativamente le costanti statistiche dell’universo (media, varianza, etc.). Allora grazie alle proprietà della distribuzione normale, gli intervalli di confidenza per la media della popolazione sono dati da: ⇒ la probabilità che un valore medio ottenuto da un singolo campione si avvicini alla media delle medie di numerosi campioni e quindi alla media dell’universo, è definita da una curva normale con media = a quella dell’universo e varianza deducibile da quella dell’universo. X m Z Cσ X X m ZC 77 σu n Applicata alla distribuzione delle medie dei campioni Applicata alla distribuzione degli elementi dell’universo 78 Progettazione e Gestione degli Impianti Industriali A.A. 2014-2015 Richiami Statistica Teoria del campione Quando il valore di σu è incognito, si può utilizzare al suo posto lo scarto quadratico medio σc del campione: σX ≅ σc Da cui: n X c m ZC σc n Applicata al singolo campione come rappresentativo dell’universo 79 20