Elementi di statistica e probabilità Eventi aleatori e deterministici • Un evento aleatorio può assumere nel corso di una prova un valore sconosciuto a priori. Si possono distinguere variabili aleatorie discrete e variabili aleatorie continue. Le variabili discrete possono assumere solo un insieme di valori numerabile, mentre i valori possibili di quelle continue non possono essere enumerati in anticipo e riempiono "densamente" un intervallo. • Il risultato di una misura può intendersi sempre come una variabile aleatoria o più precisamente la somma di un evento deterministico, che vogliamo misurare, e di altri eventi aleatori sovrapposti che abbiamo definito errori di misura. • Pertanto, per effettuare una stima corretta, sia della grandezza che vogliamo misurare, sia dell’entità degli errori, è necessario applicare correttamente le metodologie statistiche per il trattamento dei dati aleatori (nel caso in cui siamo in grado di effettuare una stima “a posteriori”) oppure la teoria della Misure Meccaniche Termiche probabilità (nel caso in cui tale stima debbae essere Università di Cassino effettuata “a priori”). 2 Concetti elementari di Statistica Unità, Campione e popolazione l’unita’ statistica rappresenta l’elemento su cui vengono osservati determinati caratteri qualitativi (colore, …) o quantitativi (volume, massa) la popolazione e’ l’insieme delle unita’ statistiche di interesse (omogenee rispetto a uno o più caratteri) il campione è un sottoinsieme di unità della popolazione. Misure Meccaniche e Termiche Università di Cassino 3 Esempi Unità, Campione e popolazione l’unita’ statistica (evento) - un autovettura - il risultato di un lancio di dadi - un errore di misura la popolazione - le autovetture circolanti a Roma - i lanci effettuati durante un gioco - i possibili errori il campione - le autovetture parcheggiate in un garage - i primi 20 lanci - gli errori commessi in una prova ripetuta Misure Meccaniche e Termiche Università di Cassino 4 Concetti elementari di Statistica Indagine statistica L’indagine statistica puo’ essere: - totale o censuaria (si rilevano i caratteri di tutte le unità della popolazione) - campionaria (si rilevano i caratteri di un campione della popolazione e per induzione si ottengono informazioni su tutta la popolazione) L’indagine campionaria necessita di un attenta progettazione per: - individuare univocamente la popolazione - evitare distorsioni sistematiche (indirettamente randomizzando la collezione delle unità o direttamente controllando l’esperimento) Misure Meccaniche e Termiche 5 Università di Cassino - collezionare un numero significativo di eventi Esempi: Errori campionari e non campionari ERRORI CAMPIONARI - campionare gli alunni per valutare l’altezza media nelle scuola senza avere definito l’età degli alunni (chi?), la regione dove si vuole fare l’indagine (dove?), il periodo di interesse (quando?) - campionare i pezzi prodotti all’inizio o al termine della produzione - effettuare solo 5 analisi per conoscere il numero medio di glucosio nel sangue degli Italiani … ERRORI NON CAMPIONARI - effettuare misure su bilance starate per difettto (portano evidentemente ad una stima distorta) - campionare confezioni di sale prodotto da una catena (per stimarne il peso medio) in un giorno in cui c’è un elevato tasso di umidità Misure Meccaniche e Termiche Università di Cassino 6 Concetti elementari di Statistica Parametri statistici – Istogramma di frequenza Tendenza centrale (Media, moda, mediana) Dispersione (scarto tipo, varianza, percentili, quartili) Frequenza 90 80 70 60 50 40 30 20 10 0 Est Ovest Nord 1° Trim. Misure Meccaniche e Termiche Università di Cassino 3° Trim. 7 Concetti elementari di probabilità Definizione Frequentista La probabilità di accadimento di un evento si ottiene ripetendo un esperimento un congruo numero di volte (numero totale di ripetizioni - nt) e contando il numero di volte in cui si verifica l’evento (numero di eventi favorevoli - nf) rispetto al numero totale di eventi LEGGE DEI GRANDI NUMERI Se un esperimento viene ripetuto molte volte la probabilità stimata tramite la frequenza relativa di un evento tende ad Meccaniche Termiche avvicinarsi alla veraMisure probabilità di equell’evento Università di Cassino 8 Esempio calcolo probabilità: Definizione frequentista • Esempio: • Durante una serata di giochi il numero 17 è uscito 10 volte su 400 giocate alla roulette. • Quale è la probabilità di ottenere il numero 17? • P(A)=10/400=1/40 Misure Meccaniche e Termiche Università di Cassino 9 Concetti elementari di probabilità Definizione Classica La probabilità di accadimento di un evento A si ottiene mediante enumerazione (oppure mediante calcolo combinatorio) degli n modi semplici favorevoli rispetto a tutti gli n modi possibili (Questa definizione può essere applicata soltanto se tutti le modalità sono equiprobabili) CALCOLO COMBINATORIO • Il calcolo combinatorio permette di determinare, senza enumerazione diretta, il numero degli elementi di un insieme o il numero dei possibili risultati di un dato esperimento. Una regola fondamentale del calcolo combinatorio consente, data una sequenza di due eventi in cui il primo può presentarsi in m modi diversi e il secondo in n modi diversi, di calcolare l’insieme dei modi possibili dei due eventi mediante il prodotto m*n Misure Meccaniche e Termiche Università di Cassino 10 Esempio calcolo probabilità: Definizione classica • Esempio: • Un convertitore analogico/ digitale ad 8 bit. Quanti valori diversi può assumere? 2*2*2*2*2*2*2*2= 256 • Quale è la probabilità di ottenere il valore 00000000? • P(A)=1/256 Misure Meccaniche e Termiche Università di Cassino 11 Concetti elementari di probabilità Definizione Soggettiva La probabilità è definita “indovinando” o “stimando” il suo valore in base a conoscenze pregresse e a circostanze particolari REGOLE FONDAMENTALI P(A) ≥ 0 P(S) = 1 Misure Meccaniche e Termiche Università di Cassino 12 Esempio calcolo probabilità: Definizione soggettiva • Esempio: • Quale è la probabilità che il Milan vinca lo scudetto? Misure Meccaniche e Termiche Università di Cassino 13 Esempio 1 - Probabilità di essere colpiti da un fulmine durante un anno • S spazio campionario è costituito da 2 eventi semplici: - A essere colpiti da un fulmine - B non esserlo • L’approccio classico non si può applicare in quanto i due eventi (fortunatamente) non sono equiprobabili • L’approccio soggettivo ci porta a “scommettere” sulla rarità dell’evento: P(A) = 1 su 1 milione • L’approccio frequentista invece ci consente analizzando i casi di italiani stati colpiti da un fulmine nel 2001 (80 persone) di scrivere: P(A) = 80 / 58 milioni = 0,000001379 Misure Meccaniche e Termiche Università di Cassino 14 Esempio 2 - Probabilità che l’errore di misura sia inferiore all’errore massimo tollerato • • - Evento A: - Evento B • I due eventi non sono equiprobabili e l’approccio classico non si applica. • possiamo usare l’approccio soggettivo (esperienza nelle verifiche effettuate dall’ispettore X durante la sua carriera): P(A) = 5 su 100 • • • • E<Em E≥Em oppure quello frequentista: nel 2003 i, su 100.000 verifiche periodiche effettuate sugli utenti metrici in Italia P(A) = 5673 / 100 mila = 0,05673 Misure Meccaniche e Termiche Università di Cassino 15 Proprietà della probabilità La probabilità di un evento impossibile è zero La probabilità di un evento complementare La probabilità che accada un evento A oppure un altro evento B (Se A e B sono mutuamente esclusivi) La probabilità che accada un evento A ed un altro evento B (Se A e B sono indipendenti) Misure Meccaniche e Termiche Università di Cassino 16 Esempi: Calcolo delle probabilità • Esempio 1 – Lancio di un dado S={1,2,3,4,5,6}; A= {0}; P(A) = Probabilità di fare somma zero P(A) = 0 • Esempio 3 – Lancio di un dado S={1,2,3,4,5,6}; A= {2,4,6}; P(A) = Probabilità di lanciare un numero pari P(A) = 1/6 + 1/6 + 1/6=3/6 • Esempio 2 – Lancio di un dado S={1,2,3,4,5,6}; A= {1}; Ac= {2,3,4,5,6} P(Ac) = Probabilità di non fare 1 P(Ac) = 1- P(Ac) = 1-1/6 = 5/6 • Esempio 4 – Lancio di due dadi S={1-1,1-2,1-3, …,6-6}; A= {6-6}; P(A) = Probabilità di lanciare due 6 P(A) = 1/6 * 1/6 =1/36 Misure Meccaniche e Termiche Università di Cassino 17 Variabili discrete e continue • Variabili discrete • Variabili continue Misure Meccaniche e Termiche Università di Cassino 18 Frequenza e probabilità mk Fk n P lim n fk mk n 1 mk x n p( x) lim x0, n Misure Meccaniche e Termiche Università di Cassino 1 mk x n 19 Media, varianza e scarto tipo Popolazione Campione Media 1 x xk n p ( x) xdx Varianza p( x)( x ) dx 2 2 Misure Meccaniche e Termiche Università di Cassino s2 1 2 x x k n 1 20 Il Modello di Gauss Tale funzione di distribuzione della densità di probabilità fu proposta per la prima volta dall'astronomo tedesco Karl Frederick Gauss. La funzione di Gauss (normale) é completamente individuata noti che siano: media scarto tipo La distribuzione normale (gaussiana) gode di alcune importanti proprietà: autoriproduzione, in quanto la risultante della composizione di più variabili aventi distribuzione normale presenta anch'essa una distribuzione normale; è distribuzione limite, perchè secondo il teorema del limite centrale data una popolazione di varianza non infinita, le medie di N elementi tratti dalla popolazione tendono ad assumere la distribuzione normale, indipendentemente dalla distribuzione della popolazione; è modello per fenomeni in fisica, chimica, biologia, sociologia, ecc. e soprattutto, come detto, per la distribuzione degli errori di misura Misure Meccaniche e Termiche Università di Cassino 21 La distribuzione di probabilità Gaussiana 1 pn ( x ) e 2 x 2 2 2 0.08 0.07 0.06 0.05 Pa x b b x 2 1 2 2 d x e 2 a 0.04 0.03 0.02 0.01 0 1205 1210 Misure Meccaniche e Termiche Università di Cassino 1215 1220 1225 1230 1235 22 Distribuzione Gaussiana Standardizzata x z pns ( z ) Misure Meccaniche e Termiche Università di Cassino 1 2 z2 e 2 23 Distribuzione Gaussiana cumulata x 2 Pn ( x) Pns ( z ) Misure Meccaniche e Termiche Università di Cassino x 2 1 e 2 d x 2 z2 z e 2 d z 1 2 24 Tabella – Funzione gaussiana cumulata z 0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2,0 f 0,398942 0,396953 0,391043 0,381388 0,368270 0,352065 0,333225 0,312254 0,289692 0,266085 0,241971 0,194186 0,171369 0,149727 0,129518 0,110921 0,094049 0,078950 0,065616 0,053991 F 0,500000 0,539828 0,579260 0,617911 0,655422 0,691462 0,725747 0,758036 0,788145 0,815940 0,841345 0,884930 0,903200 0,919243 0,933193 0,945201 0,955435 0,964070 0,971283 0,977250 z 2,1 2,3 2,4 2,5 2,6 2,7 2,8 2,9 3,0 3,1 3,2 3,3 3,4 3,5 3,6 3,7 3,8 3,9 4,0 f 0,043984 0,028327 0,022395 0,017528 0,013583 0,010421 0,007915 0,005953 0,004432 0,003267 0,002384 0,001723 0,001232 0,000873 0,000612 0,000425 0,000292 0,000199 0,000134 F 0,982136 0,989276 0,991802 0,993790 0,995339 0,996533 0,997445 0,998134 0,998650 0,999032 0,999313 0,999517 0,999663 0,999767 0,999841 0,999892 0,999928 0,999952 0,999968 Misure Meccaniche e Termiche Università di Cassino 25 Tabella – Funzione errore z P 1 1.64 1.96 2.00 2.58 3.00 3.29 0.68 0.90 0.95 0.954 0.990 0.997 0.999 Misure Meccaniche e Termiche Università di Cassino 26 Caso Notevole I: Data una distribuzione gaussiana con media e scarto tipo e un intervallo di confidenza determinare la probabiltà di accadimento P(-3 z 3) P(0 z 3) P(3 z ) P(- z 3) = 2 F(3) – 1 = = 2 0,998650 - 1= = 0.99730 = F(3) - 0.5 = = 0,998650 -0.5= = 0.49865 = 1 - F(3) = =1-0,998650= = 0.00135 = F(3)= = 0,998650 Misure Meccaniche e Termiche Università di Cassino 27 Esempio caso notevole I: misura di temperatura Si supponga che la taratura di una termocoppia fornisca una misura media di temperatura pari a T=100.0°C con uno scarto tipo di T=0.2 °C, in corrispondenza di un misurando pari a T=100.00 °C ± 0.05 °C. Qual'è la probabilità di misurare con questa termocoppia, sempre in corrispondenza di T=100.00 °C ± 0.05 °C, una temperatura compresa tra 100.2 e 100.5 °C? P(100.2T100.5) = P(1zT2.5) = F(2.5)-F(1) = 0.9938-0.8413 = 15.25 % Misure Meccaniche e Termiche Università di Cassino 28 Caso notevole II: Dato un livello di confidenza e i parametri della distribuzione gaussiana determinare l’intervallo di confidenza I parametri della distribuzione di misure, e , sono noti e si vogliono conoscere gli estremi a e b dell'intervallo, centrato su , il quale comprende un livello di probabilità fissato p. In effetti ciò si traduce nel trovare il valore zo della variabile standardizzata normale tale che: P(-zo z zo)=p Di conseguenza i valori di a e b cercati sono quelli che soddisfano la relazione: P(-zo z zo)=p P(-zo x- zo)=p P(-zo x +zo)=p quindi: a=-zo b=+zo Misure Meccaniche e Termiche Università di Cassino 29 Caso Notevole III: Dato un livello e l’intervallo di confidenza determinare la media e lo scarto tipo Sono noti sia il livello di probabilità p che gli estremi a e b dell'intervallo e si vogliono conoscere i parametri e della distribuzione di misure affinché l'intervallo [a,b], all'interno del quale cade la probabilità p, sia il più piccolo possibile. Tra tutti gli intervalli possibili il più piccolo è quello centrato sulla media , per le note proprietà della distribuzione normale. Quindi, essendo noto che P(axb)=p e sapendo che: a=-zo b=+zo ed avendo ipotizzato [a,b] centrato su si ha che: = (a+b)/2 zo = (b-a)/2 quindi: a= (a+b)/2 - zo che fornisce: = (b-a)/2zo Misure Meccaniche e Termiche Università di Cassino 30 Altre distribuzioni: t di Student • Datot x / x dove x è la media di n campioni statisticamente indipendenti di una popolazione, x, gaussiana di media e scarto tipo , la distribuzione di +t1 è: 1 2 2 p (t ) 1 t / 2 2 dove =n-1 è il numero di gradi di libertà e denota la funzione gamma di Eulero. • Più che la funzione di distribuzione interessa in questo contesto l'uso di t per campioni poco numerosi Misure Meccaniche e Termiche Università di Cassino 31 Distribuzione della media • Ciascuna stima X della media può essere riguardata come un evento aleatorio appartenente alla popolazione delle medie con media x • e deviazione standard x N Misure Meccaniche e Termiche Università di Cassino 32 Altre distribuzioni notevoli Distribuzione rettangolare Nella distribuzione rettangolare tutti i valori all'interno di un intervallo [a,b] sono equiprobabili ab 2 a b / 12 2 2 a xi b a xi b Distribuzione triangolare La densità di probabilità è finita entro l'intervallo [a,b] e nulla al suo esterno ab 2 a b / 24 2 2 Misure Meccaniche e Termiche Università di Cassino 33 Distribuzioni Correlate • Una variabile casuale z, può derivare dalla composizione di più variabili casuali. Ad esempio: z ax by •. Se x e y non sono correlate tra loro2 si ha: 2 2 2 2 E ( x y ) E ( x) E ( y ) z a x b y • Se, invece, vi è correlazione, si ha:2 2 2 2 2 E( x y) E( x ) E( y) z a x b y 2ab x, y • dove sx,y è la covarianza delle due variabili, definita come: • xy E x x y y Misure Meccaniche e Termiche Università di Cassino 34