2 Fenomeni aleatori • • Misure Meccaniche e Termiche Introduzione alla statistica I fenomeni aleatori (o casuali) sono fenomeni empirici il cui risultato non è prevedibile a priori, caratterizzati cioè dalla proprietà che la loro osservazione in un insieme fissato di circostanze non conduce sempre agli stessi risultati. Non si ha una regolarità deterministica, bensì di tipo statistico, in quanto nell'osservazione del fenomeno in oggetto si può notare che, nonostante l'irregolare comportamento dei singoli risultati, questi nel loro complesso manifestano determinati caratteri di regolarità. Sezione di Misure e Tecniche Sperimentali Introduzione alla statistica 3 4 Probabilità discreta: funzioni statistiche Probabilità discreta: dado a 6 facce Funzione di densità discreta f(x) P robabilità evento 1 punti massa 0.5 1/6 P robabilità cum ulata evento 0 -2 Introduzione alla statistica -1 1 2 3 4 5 6 Evento: faccia dado Funzione di probabilità cumulata discreta F(x) 1 0.5 1/6 0 -2 -1 0 1 2/6 3/6 5/6 4/6 2 3 4 Evento: faccia dado 5 7 8 7 8 1 6 Introduzione alla statistica 5 Valore atteso • Valore atteso: • Il valore atteso indica il baricentro della distribuzione e può non coincidere con uno dei suoi punti di massa. Nel caso del dado a 6 facce: Introduzione alla statistica 0 6 Varianza e deviazione standard • Varianza: Indica il momento di inerzia della distribuzione, cioè la sua dispersione attorno al valore medio. • Deviazione standard (scarto quadratico medio): Introduzione alla statistica 1 7 8 Serbatoio: 100 osservazioni Variabili aleatorie continue • Ipotizziamo di avere un serbatoio il cui livello può variare con continuità fra 0 e 100 e che non presenti valori di livello più probabili di altri. Istogramma occorrenze - N = 100 Num ero occorrenze 15 100 90 80 70 60 50 10 5 0 40 5 15 25 35 45 55 65 Livello serbatoio Istogramma - N = 100 5 15 25 35 30 75 85 95 75 85 95 0.02 h 20 10 0.015 0 0.5 0 -0.5 1 0.5 0 -0.5 -1 f(x) 1 • Quanto vale la probabilità associata ad un preciso valore di livello: 0.01 0.005 0 Introduzione alla statistica 45 55 65 Livello serbatoio Introduzione alla statistica 9 10 Serbatoio: 1000 e 100mila osservazioni Serbatoio: 100mila osservazioni Istogramma occorrenze - N = 1000 Istogramma occorrenze - N = 100000 5 15 25 35 45 55 65 Livello serbatoio Istogramma - N = 1000 75 85 5000 0.015 0.015 0.01 0.01 0.008 0 0 95 0.01 5000 5 15 25 35 45 55 65 Livello serbatoio Istogramma - N = 100000 75 85 95 5 15 25 35 45 55 65 Livello serbatoio Istogramma - N = 100000 75 85 95 f(x) 0 0.012 10000 Numero occorrenze Numero occorrenze Numero occorrenze 50 Istogramma - N = 100000 Istogramma occorrenze - N = 100000 10000 100 0.006 0.015 0.004 f(x) f(x) f(x) 0.01 0.005 0.002 0.005 0.005 0 0 5 15 25 35 45 55 Livello serbatoio 65 75 85 0 95 5 15 25 35 45 55 Livello serbatoio 65 75 85 5 15 25 95 L'aumento delle osservazioni porta ad una maggiore conoscenza del fenomeno aleatorio Introduzione alla statistica 35 45 55 Livello serbatoio 65 75 85 95 0 0 10 20 30 40 50 60 Livello serbatoio 100 12 Funzione densità di probabilità per v.a. continue Istogramma - N = 10000000 Istogramma occorrenze - N = 10000000 0.012 0.01 • Si intuisce che se avessimo una conoscenza completa del fenomeno aleatorio N → ∞ , potremmo fare tendere a 0 la base degli istogrammi. Si continuerebbe ad avere un numero finito di osservazioni in ogni intervallo. 5 0.008 0 5 15 25 35 45 55 65 Livello serbatoio Istogramma - N = 10000000 75 85 95 f(x) Numero occorrenze 5 90 Riducendo le ampiezze delle basi degli istogrammi (aumentando la “risoluzione”) il fenomeno non mantiene la propria regolarità 11 x 10 80 Introduzione alla statistica Serbatoio: 10 milioni di osservazioni 10 70 0.006 0.015 0.004 f(x) 0.01 0.002 0.005 0 5 15 25 35 45 55 Livello serbatoio 65 75 85 95 0 0 10 20 30 40 50 60 Livello serbatoio 70 80 90 100 • Questo passaggio al limite ci consente di ottenere una funzione continua: la funzione densità di probabilità (per v.a. continue). Riducendo le ampiezze delle basi degli istogrammi il fenomeno ora mantiene la propria regolarità Introduzione alla statistica Introduzione alla statistica 2 13 14 Distribuzione continua uniforme o rettangolare Indici statistici Introduzione alla statistica Introduzione alla statistica 15 16 f(x) discrete Vs f(x) continue v.a. continue: calcolo probabilità • La differenza fra le funzioni densità discrete e continue non è solo formale (sostituzione delle sommatorie con gli integrali): f(x) per v.a. discrete esprimono una probabilità f(x) per v.a. continue esprimono una densità di probabilità: la probabilità è associata ad intervalli e si determina quindi mediante un'operazione di integrazione Introduzione alla statistica Introduzione alla statistica 17 18 Famiglie di distribuzioni Distribuzione Normale o Gaussiana PDF gaussiana standardizzata 0.4 0.3 f(x) • Tutte le funzioni che soddisfano le proprietà analizzate precedentemente sono possibili funzioni densità di probabilità f (x, , ) 0.2 0.1 • Solo alcune di esse sono però adeguate per modellare particolari fenomeni fisici Introduzione alla statistica -2 -1 0 1 X CDF gaussiana standardizzata 2 3 2 2 4 0.5 0 -4 x 2 x -3 1 F(x) • In questo corso sono di interesse: Uniforme (già analizzata) Normale o Gaussiana T-Student 0 -4 1 e 2 -3 -2 -1 0 X 1 2 3 4 La normale o gaussiana è la distribuzione che descrive la maggior parte dei fenomeni fisici in campo ingegneristico. Introduzione alla statistica 3 19 20 Distribuzione normale o gaussiana N(,2) Caratteristiche della Gaussiana La distribuzione gaussiana è completamente descritta da due parametri: media e varianza 2. Influenza della deviazione standard Influenza della media 0.4 0.7 0 1 2 0.35 0.5 1 2 0.6 0.3 • circa il 95.5% della distribuzione è compreso nell’intervallo centrato su e di estremi 2 0.5 0.25 0.4 0.2 • circa il 99.7% della distribuzione è compreso nell’intervallo centrato su e di estremi 3 0.3 0.15 0.2 0.1 0.1 0.05 0 -5 0 5 0 -5 • circa il 68% della distribuzione è compreso nell’intervallo centrato su e di estremi 0 Introduzione alla statistica 5 Introduzione alla statistica 21 Distribuzione normale standard N(,1) 22 Distribuzione t-Student • Di particolare importanza è la normale standard, ovvero la distribuzione normale che ha media 0 e varianza (e deviazione standard) pari a 1 (si indica con N(0,1)). Proprietà: se X N(,2) se X è una variabile distribuita secondo una normale di media e varianza 2, la variabile è distribuita secondo una normale standard. • Z è definita variabile standardizzata: consente un semplice uso delle tabelle e consente di effettuare delle valutazioni “normalizzate” (es: entro l'intervallo media 2 deviazioni standard è compreso circa il 95% della distribuzione, per qualsiasi distribuzione gaussiana). Introduzione alla statistica Introduzione alla statistica 23 Relazioni utili • Per le distribuzioni simmetriche (Gaussiana, t-Student, …) valgono le seguenti proprietà: • Se la distribuzione è a media nulla: Tabelle statistiche Introduzione alla statistica Introduzione alla statistica 4 25 26 Introduzione alla statistica Introduzione alla statistica 27 28 Esempio uso tabelle statistiche 0.2 0.15 f(x) Si calcolino gli estremi dell'intervallo di confidenza al 90% di una N(30,2). 0.1 0.90 0.05 0.05 0.05 0.2 0.18 0 22 0.90 24 26 28 0.16 0.14 32 34 36 38 0.95 0.15 f(x) 0.12 f(x) 30 X 0.2 0.1 0.05 0.1 0.05 0.08 0.06 0.04 0 22 0.05 0.05 24 26 28 30 X 32 34 36 38 0.02 0 22 24 26 28 30 X 32 34 36 38 Introduzione alla statistica Introduzione alla statistica 29 Quando si effettua una misura si cerca di ottenere un valore misurato che sia il più vicino possibile al valore vero (sconosciuto e non conoscibile) della grandezza di interesse. Applicazione della statistica alle misure Introduzione alla statistica Introduzione alla statistica 5 Se si fanno ripetere le misure di lunghezza del pesce a diversi pescatori si otterranno valori diversi. Le cause della diversità delle misure rilevata sono molte, e si possono schematizzare in due gruppi: • effetti sistematici (tirare la coda, misurare lungo la corda) • effetti casuali Altro esempio: misure ripetute nel tempo effetti sistematici + casuali effetti casuali Come trattare tutte queste misure diverse ??? Soluzione: LA STATISTICA Introduzione alla statistica Introduzione alla statistica Altro esempio: misure di pressione di un recipiente Numero rilevazione Lettura [kPa] 1 10.02 2 10.20 3 10.26 4 10.20 5 10.22 6 10.13 7 9.97 8 10.12 9 10.09 10 9.90 11 10.05 12 10.17 13 10.42 14 10.21 15 10.23 16 10.11 17 9.98 18 10.10 19 10.04 Introduzione alla20 statistica Si sono effettuate 20 misure di pressione in un recipiente: Le misure non sono tutte uguali! Quale è la misura che possiamo dire essere il valore di pressione esistente nel recipiente ? 9.81 Si può procedere così così: si dispongano i dati rilevati in ordine crescente e si suddividano in intervalli omogenei (in questo caso si sceglie 0.05 kPa). kPa). Si definisca: • n = numero di letture in un intervallo • N = numero totale di letture • a = ampiezza di un intervallo e infine la funzione densità densità di probabilità probabilità discreta fX(x): (x): f X ( x) Introduzione alla statistica 34 Introduzione alla statistica Numero di letture nell’ nell’intervallo fX(x) Se si traccia un intervallo di altezza fX(x) per ogni intervallo si ottiene: n n f X ( x) n N a 20 0.05 n Na Ipotizzando: Densità Densità di probabilità probabilità discreta N a 0 Densità Densità di probabilità probabilità continua Introduzione alla statistica 6 Funzione densità di probabilità DISTRIBUZIONE STATISTICA 38 DELLE MISURE Probabilità Probabilità che a<x<b b p a x b f x dx • a Il teorema del limite centrale ci assicura che, sotto opportune ipotesi, una misura esente da effetti sistematici può essere modellata mediante una distribuzione gaussiana. Probabilità Probabilità che x<a a F a f x dx Funzione di distribuzione cumulata Introduzione alla statistica Introduzione alla statistica LA FUNZIONE DI DENSITA’ DENSITA’ NORMALE o GAUSSIANA 1 f x 2 e x 2 2 2 LA GAUSSIANA E’ E’ COMPLETAMENTE DESCRITTA DA DUE PARAMETRI: MEDIA MEDIA DEVIAZIONE DEVIAZIONE STANDARD F x x ( o la varianza 2 ) x f x dx Introduzione alla statistica Introduzione alla statistica INFLUENZA DI MEDIA E DEVIAZIONE STANDARD DEVIAZIONE STANDARD NUMERO INFINITO DI CAMPIONI: : MEDIA : DEVIAZIONE STANDARD MEDIA MA NON SI POSSONO EFFETTUARE UN NUMERO INFINITO DI RILEVAZIONI : SI DEVE TROVARE UN SISTEMA PER STIMARE MEDIA E DEVIAZ. ST. ST. Introduzione alla statistica Introduzione alla statistica 7 AVENDO DIVERSE SERIE DI MISURAZIONI POTREMO CALCOLARE PER OGNUNA DI QUESTE LA MEDIA, ESSE NON SARANNO TUTTE UGUALI E SI DISTRIBUIRANNO SU SI UTILIZZANO I SEGUENTI STIMATORI N Media campionaria X x i 1 x s i 1 DISTRIBUZIONE DELLE MEDIE CAMPIONARIE m, m N N Deviazione standard campionaria UNA GAUSSIANA i i X DISTRIBUZIONE CAMPIONARIA , X 2 m= m N 1 Con xi= singola lettura e N = numero rilevazioni Introduzione alla statistica Introduzione alla statistica 45 Caratteristiche della Gaussiana • circa il 68% della distribuzione è compreso nell’intervallo centrato su e di estremi • circa il 95.5% della distribuzione è compreso nell’intervallo centrato su e di estremi 2 • circa il 99.7% della distribuzione è compreso nell’intervallo centrato su e di estremi 3 46 Si può quindi stimare che: Circa il 68%degli intervalli così costruiti contiene il valore vero (livello di confidenza 68%) X s N Circa il 95.5%degli intervalli così costruiti contiene il valore vero (livello di confidenza 95.5%) X 2s N Circa il 99.7%degli intervalli così costruiti contiene il valore vero (livello di confidenza 99.7%) X Introduzione alla statistica N 3s N Introduzione alla statistica 8