4 dis - Unicas

Elementi di statistica e
probabilità
Eventi aleatori e deterministici
•
Un evento aleatorio può assumere nel corso di una
prova un valore sconosciuto a priori. Si possono
distinguere variabili aleatorie discrete e variabili
aleatorie continue. Le variabili discrete possono
assumere solo un insieme di valori numerabile,
mentre i valori possibili di quelle continue non
possono essere enumerati in anticipo e riempiono
"densamente" un intervallo.
•
Il risultato di una misura può intendersi sempre
come una variabile aleatoria o più precisamente la
somma di un evento deterministico, che vogliamo
misurare, e di altri eventi aleatori sovrapposti che
abbiamo definito errori di misura.
•
Pertanto, per effettuare una stima corretta, sia della
grandezza che vogliamo misurare, sia dell’entità
degli errori, è necessario applicare correttamente le
metodologie statistiche per il trattamento dei dati
aleatori (nel caso in cui siamo in grado di effettuare
una stima “a posteriori”) oppure la teoria della
Misure
Meccaniche
Termiche probabilità (nel caso in cui tale
stima
debbae essere
Università di Cassino
effettuata “a priori”).
2
Concetti elementari di Statistica
Unità, Campione e popolazione
 l’unita’ statistica rappresenta
l’elemento su cui vengono
osservati determinati caratteri
qualitativi (colore, …) o
quantitativi (volume, massa)
 la popolazione e’ l’insieme
delle unita’ statistiche di
interesse (omogenee rispetto
a uno o più caratteri)
 il campione è un sottoinsieme
di unità della popolazione.
Misure Meccaniche e Termiche Università di Cassino
3
Esempi
Unità, Campione e popolazione
 l’unita’ statistica (evento)
- un autovettura
- il risultato di un lancio di dadi
- un errore di misura
 la popolazione
- le autovetture circolanti a Roma
- i lanci effettuati durante un gioco
- i possibili errori
 il campione
- le autovetture parcheggiate in un
garage
- i primi 20 lanci
- gli errori commessi in una prova
ripetuta
Misure Meccaniche e Termiche Università di Cassino
4
Concetti elementari di Statistica
Indagine statistica
 L’indagine statistica puo’ essere:
- totale o censuaria (si rilevano i caratteri di tutte le unità
della popolazione)
- campionaria (si rilevano i caratteri di un campione della
popolazione e per induzione si ottengono informazioni su
tutta la popolazione)
 L’indagine campionaria necessita di un attenta progettazione
per:
- individuare univocamente la popolazione
- evitare distorsioni sistematiche (indirettamente
randomizzando la collezione delle unità o direttamente
controllando l’esperimento)
Misure Meccaniche e Termiche 5
Università di Cassino
- collezionare un numero
significativo di eventi
Esempi:
Errori campionari e non campionari
 ERRORI CAMPIONARI
- campionare gli alunni per valutare l’altezza media nelle scuola
senza avere definito l’età degli alunni (chi?), la regione dove si vuole
fare l’indagine (dove?), il periodo di interesse (quando?)
- campionare i pezzi prodotti all’inizio o al termine della produzione
- effettuare solo 5 analisi per conoscere il numero medio di glucosio
nel sangue degli Italiani …
 ERRORI NON CAMPIONARI
- effettuare misure su bilance starate per difettto (portano
evidentemente ad una stima distorta)
- campionare confezioni di sale prodotto da una catena (per
stimarne il peso medio) in un giorno in cui c’è un elevato tasso di
umidità
Misure Meccaniche e Termiche Università di Cassino
6

Concetti elementari di Statistica
Parametri statistici – Istogramma di
frequenza
Tendenza centrale (Media,
moda,
mediana)
 Dispersione (scarto tipo, varianza,
percentili, quartili)
 Frequenza
90
80
70
60
50
40
30
20
10
0
Est
Ovest
Nord
1°
Trim.
Misure Meccaniche e Termiche Università di Cassino
3°
Trim.
7
Concetti elementari di probabilità
Definizione Frequentista
La probabilità di accadimento di un evento si ottiene ripetendo
un esperimento un congruo numero di volte (numero totale di
ripetizioni - nt) e contando il numero di volte in cui si verifica
l’evento (numero di eventi favorevoli - nf) rispetto al numero
totale di eventi
LEGGE DEI GRANDI NUMERI
Se un esperimento viene ripetuto molte volte la probabilità
stimata tramite la frequenza relativa di un evento tende ad
Meccaniche
Termiche avvicinarsi alla veraMisure
probabilità
di equell’evento
Università di Cassino
8
Esempio calcolo probabilità:
Definizione frequentista
• Esempio:
• Durante una serata di
giochi il numero 17 è
uscito 10 volte su 400
giocate alla roulette.
• Quale è la probabilità di
ottenere il numero 17?
• P(A)=10/400=1/40
Misure Meccaniche e Termiche Università di Cassino
9
Concetti elementari di probabilità
Definizione Classica
La probabilità di accadimento di un evento A si ottiene mediante
enumerazione (oppure mediante calcolo combinatorio) degli n modi
semplici favorevoli rispetto a tutti gli n modi possibili
(Questa definizione può essere applicata soltanto se tutti le modalità
sono equiprobabili)
CALCOLO COMBINATORIO
• Il calcolo combinatorio permette di determinare, senza
enumerazione diretta, il numero degli elementi di un insieme o il
numero dei possibili risultati di un dato esperimento. Una regola
fondamentale del calcolo combinatorio consente, data una sequenza
di due eventi in cui il primo può presentarsi in m modi diversi e il
secondo in n modi diversi, di calcolare l’insieme dei modi possibili
dei due eventi mediante il prodotto m*n
Misure Meccaniche e Termiche Università di Cassino
10
Esempio calcolo probabilità:
Definizione classica
• Esempio:
• Un convertitore analogico/
digitale ad 8 bit. Quanti valori
diversi può assumere?
2*2*2*2*2*2*2*2=
256
• Quale è la probabilità di
ottenere il valore 00000000?
• P(A)=1/256
Misure Meccaniche e Termiche Università di Cassino
11
Concetti elementari di probabilità
Definizione Soggettiva
La probabilità è definita “indovinando” o “stimando” il suo valore in
base a conoscenze pregresse e a circostanze particolari
REGOLE FONDAMENTALI
P(A) ≥ 0
P(S) = 1
Misure Meccaniche e Termiche Università di Cassino
12
Esempio calcolo probabilità:
Definizione soggettiva
• Esempio:
• Quale è la probabilità che il
Milan vinca lo scudetto?
Misure Meccaniche e Termiche Università di Cassino
13
Esempio 1 - Probabilità di essere colpiti da un
fulmine durante un anno
•
S spazio campionario è costituito da 2 eventi semplici:
- A essere colpiti da un fulmine
- B non esserlo
•
L’approccio classico non si può applicare in quanto i due eventi
(fortunatamente) non sono equiprobabili
•
L’approccio soggettivo ci porta a “scommettere” sulla rarità
dell’evento:
P(A) = 1 su 1 milione
•
L’approccio frequentista invece ci consente analizzando i casi di
italiani stati colpiti da un fulmine nel 2001 (80 persone) di scrivere:
P(A) = 80 / 58 milioni = 0,000001379
Misure Meccaniche e Termiche Università di Cassino
14
Esempio 2 - Probabilità che l’errore di
misura sia inferiore all’errore massimo
tollerato
•
•
- Evento A:
- Evento B
•
I due eventi non sono equiprobabili e l’approccio classico non si
applica.
•
possiamo usare l’approccio soggettivo (esperienza nelle verifiche
effettuate dall’ispettore X durante la sua carriera):
P(A) = 5 su 100
•
•
•
•
E<Em
E≥Em
oppure quello frequentista:
nel 2003 i, su 100.000 verifiche periodiche effettuate sugli utenti
metrici in Italia
P(A) = 5673 / 100 mila = 0,05673
Misure Meccaniche e Termiche Università di Cassino
15
Proprietà della probabilità
 La probabilità di un
evento impossibile è zero
 La probabilità di un
evento complementare
 La probabilità che accada
un evento A oppure un
altro evento B (Se A e B
sono mutuamente
esclusivi)
 La probabilità che accada
un evento A ed un altro
evento B (Se A e B sono
indipendenti)
Misure Meccaniche e Termiche Università di Cassino
16
Esempi:
Calcolo delle probabilità
•
Esempio 1 – Lancio di un dado
S={1,2,3,4,5,6};
A= {0};
P(A) = Probabilità di fare somma
zero
P(A) = 0
•
Esempio 3 – Lancio di un dado
S={1,2,3,4,5,6}; A= {2,4,6};
P(A) = Probabilità di lanciare un
numero pari
P(A) = 1/6 + 1/6 + 1/6=3/6
•
Esempio 2 – Lancio di un dado
S={1,2,3,4,5,6};
A= {1}; Ac= {2,3,4,5,6}
P(Ac) = Probabilità di non fare 1
P(Ac) = 1- P(Ac) = 1-1/6 = 5/6
•
Esempio 4 – Lancio di due dadi
S={1-1,1-2,1-3, …,6-6}; A= {6-6};
P(A) = Probabilità di lanciare due
6
P(A) = 1/6 * 1/6 =1/36
Misure Meccaniche e Termiche Università di Cassino
17
Variabili discrete e continue
• Variabili discrete
• Variabili continue
Misure Meccaniche e Termiche Università di Cassino
18
Frequenza e probabilità
mk
Fk 
n
P  lim n
fk 
mk
n
1 mk
x n
p( x)  lim x0, n
Misure Meccaniche e Termiche Università di Cassino
1 mk
x n
19
Media, varianza e scarto tipo
Popolazione
Campione
Media

1
x   xk
n
 
 p ( x)  xdx
Varianza


   p( x)( x   ) dx
2
2
Misure Meccaniche e Termiche Università di Cassino
s2 
1
2


x

x
 k
n 1
20
Il Modello di Gauss
Tale funzione di distribuzione della densità di probabilità fu proposta per
la prima volta dall'astronomo tedesco Karl Frederick Gauss. La funzione
di Gauss (normale) é completamente individuata noti che siano:
 media
 scarto tipo
La distribuzione normale (gaussiana) gode di alcune importanti proprietà:



autoriproduzione, in quanto la risultante della composizione di più
variabili aventi distribuzione normale presenta anch'essa una
distribuzione normale;
è distribuzione limite, perchè secondo il teorema del limite centrale data
una popolazione di varianza non infinita, le medie di N elementi tratti
dalla popolazione tendono ad assumere la distribuzione normale,
indipendentemente dalla distribuzione della popolazione;
è modello per fenomeni in fisica, chimica, biologia, sociologia, ecc. e
soprattutto, come detto, per la distribuzione degli errori di misura
Misure Meccaniche e Termiche Università di Cassino
21
La distribuzione di probabilità Gaussiana
1
pn ( x ) 
e
 2

x   2

2 2
0.08
0.07
0.06
0.05
Pa  x  b 
b
 x   2
1
2 2 d x
e

 2 a
0.04
0.03
0.02
0.01
0
1205
1210
Misure Meccaniche e Termiche Università di Cassino
1215
1220
1225
1230
1235
22
Distribuzione Gaussiana Standardizzata

x  
z

pns ( z ) 
Misure Meccaniche e Termiche Università di Cassino
1
2
z2

e 2
23
Distribuzione Gaussiana cumulata
 x   2
Pn ( x) 
Pns ( z ) 
Misure Meccaniche e Termiche Università di Cassino
x
2
1
 e 2 d x
 2  
z2
z 
e 2 d z
1
2  
24
Tabella – Funzione gaussiana
cumulata
z
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
1,2
1,3
1,4
1,5
1,6
1,7
1,8
1,9
2,0
f
0,398942
0,396953
0,391043
0,381388
0,368270
0,352065
0,333225
0,312254
0,289692
0,266085
0,241971
0,194186
0,171369
0,149727
0,129518
0,110921
0,094049
0,078950
0,065616
0,053991
F
0,500000
0,539828
0,579260
0,617911
0,655422
0,691462
0,725747
0,758036
0,788145
0,815940
0,841345
0,884930
0,903200
0,919243
0,933193
0,945201
0,955435
0,964070
0,971283
0,977250
z
2,1
2,3
2,4
2,5
2,6
2,7
2,8
2,9
3,0
3,1
3,2
3,3
3,4
3,5
3,6
3,7
3,8
3,9
4,0
f
0,043984
0,028327
0,022395
0,017528
0,013583
0,010421
0,007915
0,005953
0,004432
0,003267
0,002384
0,001723
0,001232
0,000873
0,000612
0,000425
0,000292
0,000199
0,000134
F
0,982136
0,989276
0,991802
0,993790
0,995339
0,996533
0,997445
0,998134
0,998650
0,999032
0,999313
0,999517
0,999663
0,999767
0,999841
0,999892
0,999928
0,999952
0,999968
Misure Meccaniche e Termiche Università di Cassino
25
Tabella – Funzione errore
z
P
1
1.64 1.96 2.00 2.58 3.00 3.29
0.68 0.90 0.95 0.954 0.990 0.997 0.999
Misure Meccaniche e Termiche Università di Cassino
26
Caso Notevole I:
Data una distribuzione gaussiana con media  e scarto
tipo  e un intervallo di confidenza determinare la
probabiltà di accadimento
P(-3  z  3)
P(0  z  3)
P(3  z  )
P(-  z  3)
= 2 F(3) – 1 =
= 2 0,998650 - 1=
= 0.99730
= F(3) - 0.5 =
= 0,998650 -0.5=
= 0.49865
= 1 - F(3) =
=1-0,998650=
= 0.00135
= F(3)=
= 0,998650
Misure Meccaniche e Termiche Università di Cassino
27
Esempio caso notevole I:
misura di temperatura
Si supponga che la taratura di una termocoppia fornisca una
misura media di temperatura pari a T=100.0°C con uno scarto
tipo di T=0.2 °C, in corrispondenza di un misurando pari a
T=100.00 °C ± 0.05 °C.
Qual'è la probabilità di misurare con questa termocoppia,
sempre in corrispondenza di T=100.00 °C ± 0.05 °C, una
temperatura compresa tra 100.2 e 100.5 °C?
P(100.2T100.5) = P(1zT2.5) =
F(2.5)-F(1) = 0.9938-0.8413 = 15.25 %
Misure Meccaniche e Termiche Università di Cassino
28
Caso notevole II:
Dato un livello di confidenza e i parametri della
distribuzione gaussiana determinare l’intervallo di
confidenza
I parametri della distribuzione di misure,  e , sono noti e si
vogliono conoscere gli estremi a e b dell'intervallo, centrato su
, il quale comprende un livello di probabilità fissato p.
In effetti ciò si traduce nel trovare il valore zo della variabile
standardizzata normale tale che:
P(-zo  z  zo)=p
Di conseguenza i valori di a e b cercati sono quelli che
soddisfano la relazione:
P(-zo z zo)=p
P(-zo x- zo)=p
P(-zo x +zo)=p
quindi:
a=-zo

b=+zo
Misure Meccaniche e Termiche Università di Cassino
29
Caso Notevole III:
Dato un livello e l’intervallo di confidenza
determinare la media e lo scarto tipo
Sono noti sia il livello di probabilità p che gli estremi a e b
dell'intervallo e si vogliono conoscere i parametri  e  della
distribuzione di misure affinché l'intervallo [a,b], all'interno del
quale cade la probabilità p, sia il più piccolo possibile.
Tra tutti gli intervalli possibili il più piccolo è quello centrato
sulla media , per le note proprietà della distribuzione normale.
Quindi, essendo noto che P(axb)=p e sapendo che:
a=-zo
b=+zo
ed avendo ipotizzato [a,b] centrato su si ha che:

= (a+b)/2
zo = (b-a)/2
quindi:
a= (a+b)/2 - zo
che fornisce:  = (b-a)/2zo
Misure Meccaniche e Termiche Università di Cassino
30
Altre distribuzioni: t di Student
• Datot  x  / x dove x è la media di
n campioni statisticamente
indipendenti di una popolazione, x,
gaussiana di media  e scarto tipo ,
la distribuzione di
 +t1 è:


 1

2 
2

p (t ) 
1 t /  2

 
2


dove =n-1 è il numero di gradi di
libertà e  denota la funzione
gamma di Eulero.
• Più che la funzione di distribuzione
interessa in questo contesto l'uso di t
per campioni poco numerosi
Misure Meccaniche e Termiche Università di Cassino
31
Distribuzione della media
• Ciascuna stima X della media
può essere riguardata come
un evento aleatorio
appartenente alla popolazione
delle medie con media
x  
• e deviazione standard

x 
N
Misure Meccaniche e Termiche Università di Cassino
32
Altre distribuzioni notevoli
 Distribuzione rettangolare
Nella distribuzione rettangolare
tutti i valori all'interno di un
intervallo [a,b] sono equiprobabili
ab

2
  a  b / 12
2
2
a
xi
b
a
xi
b
 Distribuzione triangolare
La densità di probabilità è
finita entro l'intervallo [a,b] e
nulla al suo esterno
ab

2
  a  b / 24
2
2
Misure Meccaniche e Termiche Università di Cassino
33
Distribuzioni Correlate
• Una variabile casuale z, può derivare dalla
composizione di più variabili casuali. Ad
esempio:
z  ax  by
•. Se x e y non sono correlate
tra
loro2 si
ha:
2
2 2
2
E ( x  y )  E ( x)  E ( y )
z  a x  b  y
• Se, invece, vi è correlazione,
si ha:2 2
2
2 2
E( x  y)  E( x )  E( y)  z  a  x  b  y  2ab x, y
• dove sx,y è la covarianza delle due variabili,
definita come:

•

 xy  E x   x  y   y

Misure Meccaniche e Termiche Università di Cassino
34