Lezione 7

La distribuzione normale o distribuzione di Gauss
Gauss ha dimostrato che secondo questa legge si possono ritenere
distribuiti gli errori accidentali di misura di una qualsivoglia
grandezza.
Densità di probabilità:
p (x ) =
 1 x - µ ( x ) 2 
e x p 
 
 2  σ (x)  
 2 πσ (x)
√
1
Poichè la curva è simmetrica la media, la mediana e la moda coincidono
tra loro.
Cambiare il valore della media µ (x) equivale a fare scorrere lungo l'asse
delle ascisse il grafico che rappresenta la densità di probabilità p(x).
Cambiare il valore dello scarto quadratico medio σ (x ) equivale a
cambiare la forma del grafico.
Probabilità che la x sia contenuta in un certo intervallo:
- intervallo [ µ (x ) - σ (x ), µ (x ) + σ (x )]
→
probabilità uguale a 0,683;
- intervallo [ µ (x ) - 2 σ (x ), µ (x ) + 2 σ (x )]
→
probabilità uguale a 0,945;
- intervallo [ µ (x ) - 3 σ (x ), µ (x ) + 3 σ (x )]
→
probabilità uguale a 0,997.
0.25
0.2
p(x)
0.15
0.1
σ(x)
σ(x)
0.05
µ(x)
0
0
2
4
6
8
10
12
x
Distribuzione di Gauss
14
16
18
20
0,200
p(x)
a
b
0,100
0,000
-10
0
10
20
30
40
x
Funzioni di densità di probabilità di due distribuzioni normali con
diverso valore della media µ (x ) (10 per la distribuzione a e 20 per la
distribuzione b) e uguale valore (2,5) dello scarto quadratico medio σ (x)
0,200
p(x)
a
0,100
b
0,000
-10
0
10
20
30
40
x
Funzioni di densità di probabilità di due distribuzioni normali con
uguale valore (10) della media µ (x ) e diverso valore dello scarto
quadratico medio σ ( x )
(2,5 per la distribuzione a e 5 per la
distribuzione b)
Il teorema del limite centrale
N variabili casuali indipendenti x 1 , x 2 , ..., x N
variabile casuale
→
N
z=
∑xi
i= 1
La distribuzione della variabile z tende a essere normale, al tendere di
N a infinito, quali che siano le funzioni di probabilità delle variabili
originarie.
La distribuzione normale in forma canonica
x
∫p(x)dx
P (x ) =
-∞
x
1
 1 x - µ ( x ) 2 
P (x ) = ⌠
e
x
p

 dx

2
σ
(x)


 
 2 πσ (x)
⌡√
-∞
La funzione non è integrabile analiticamente: P (x) si deve calcolare per
mezzo di un procedimento numerico approssimato.
In passato i valori della probabilità P (x) erano tabulati.
Oggi si calcolano per mezzo di un codice di calcolo automatico.
u=
x - µ (x )
σ (x)
variabile ridotta o standardizzata
P (u) = P (x)
p(u) = p(x)
dx
= σ (x )
du
probabilità di non superamento
dx
du
→
p(u) = p(x) σ (x)
p (u ) =
u2 
e x p  
 2 
 2 π
√
densità di probabilità
µ (u ) =
µ (x ) - µ (x )
= 0
σ (x)
σ (u) =
1
σ (x)
= 1
σ (x)
Funzione di probabilità della distribuzione di Gauss. Valori
della variabile ridotta u
in funzione di quelli della
probabilità di non superamento P .
P
u
.5000
.0000
.5050
.0125
.5100
.0250
.5150
.0375
.5200
.0500
.5250
.0625
.5300
.0751
.5350
.0876
.5400
.1002
.5450
.1128
P
u
.5500
.1254
.5550
.1380
.5600
.1507
.5650
.1633
.5700
.1760
.5750
.1888
.5800
.2015
.5850
.2143
.5900
.2271
.5950
.2400
P
u
.6000
.2529
.6050
.2659
.6100
.2789
.6150
.2919
.6200
.3050
.6250
.3182
.6300
.3314
.6350
.3447
.6400
.3580
.6450
.3714
P
u
.6500
.3849
.6550
.3984
.6600
.4120
.6650
.4257
.6700
.4395
.6750
.4533
.6800
.4673
.6850
.4813
.6900
.4954
.6950
.5097
P
u
.7000
.5240
.7050
.5384
.7100
.5530
.7150
.5677
.7200
.5825
.7250
.5974
.7300
.6125
.7350
.6277
.7400
.6430
.7450
.6585
P
u
.7500
.6742
.7550
.6900
.7600
.7060
.7650
.7222
.7700
.7386
.7750
.7552
.7800
.7720
.7850
.7890
.7900
.8062
.7950
.8237
P
u
.8000
.8415
.8050
.8595
.8100
.8778
.8150
.8964
.8200
.9153
.8250
.9345
.8300
.9541
.8350
.9741
.8400
.8450
.9944 1.0152
P
u
.8500
.8550
1.0364 1.0581
.8600
.8650
1.0804 1.1031
.8700
.8750
1.1265 1.1504
.8800
.8850
1.1751 1.2005
.8900
.8950
1.2267 1.2537
P
u
.9000
.9050
1.2817 1.3108
.9100
.9150
1.3410 1.3724
.9200
.9250
1.4053 1.4398
.9300
.9350
1.4761 1.5144
.9400
.9450
1.5551 1.5985
P
u
.9500
.9550
1.6452 1.6958
.9600
.9650
1.7511 1.8123
.9700
.9750
1.8812 1.9604
.9800
.9850
2.0542 2.1705
.9900
.9950
2.3268 2.5762
P
u
.9900
.9910
2.3268 2.3661
.9920
.9930
2.4093 2.4577
.9940
.9950
2.5126 2.5762
.9960
.9970
2.6525 2.7481
.9980
.9990
2.8785 3.0905
P
u
.9990
.9991
3.0905 3.1217
.9992
.9993
3.1562 3.1949
.9994
.9995
3.2391 3.2908
.9996
.9997
3.3530 3.4319
.9998
.9999
3.5404 3.7194
(A causa della simmetria della distribuzione non sono tabulati i
valori negativi della variabile ridotta.)
Approssimazione numerica della
distribuzione di Gauss per u ≥ 0
p (u ) =
funzione
di
probabilità
u2 
e x p  
 2 
2π

√
1
u
P (u ) =
∫ p(u)d u
- ∞
r
b1
b2
b3
b4
b5
=
=
=
=
=
=
f =
0,2316419
0,31938153
-0,356563782
1,781477937
-1,821255978
1,330274429
u2 
e x p  
 2 
2π

√
1
t =
1
1 + ru
P ( u ) ≅ 1 - f( b 1 t + b 2 t 2 + b 3 t 3 + b 4 t 4 + b 5 t 5 )
della
Approssimazione numerica dell'inversa della funzione
probabilità della distribuzione di Gauss per P ≥ 0,5
u
P (u ) =
∫ p(u)d u
- ∞
c0
c1
c2
d1
d2
d3
=
=
=
=
=
=
t=
2,515517
0,802853
0,010328
1,432788
0,189269
0,001308
√
ln
1
( 1 - P )2
u ≅ t - \ S \ D O 3 ( \ F ( c 0 + c 1 t + c 2 t2 ; 1 + d 1 t + d 2 t2 + d 3 t3 )) .
di
Distribuzione
di
Gauss
-
Esempi
di
calcolo
________________________________________________________
Parametri della distribuzione:
µ (x) = 5 0 0
σ (x) = 1 0 0
________________________________________________________
Determinazione della probabilità di non superamento P(x) di un valore
della x assegnato:
x = 650
u = (650 - 500)/100 = 1 , 5
u
→
P(u)
(codice di calcolo o tabella)
P (u) = 0,9332
P(x) = P(u)
P (x) = 0 , 9 3 3 2
________________________________________________________
Determinazione del valore della variabile x con probabilità di non
superamento P(x) assegnata:
P (x) = 0 , 8
P (u) = P (x)
P (u) = 0 , 8
P(u) →
u
(codice di calcolo o tabella)
u = 0,8415
x = µ (x ) + u σ (x ) = 5 0 0 + 0 , 8 4 1 5 × 1 0 0 = 5 8 4 , 1 5
Distribuzione lognormale a due parametri
y = ln x
p (x ) =
variabile
trasformata
 1 l n x - µ ( y ) 2 
e x p 
 
σ (y)
 2 
 
x√
 2 πσ (y)
1
La distribuzione della x è limitata inferiormente e ha come limite zero.
La distribuzione della variabile originaria x non è simmetrica.
Relazioni tra media e varianza della variabile originaria x e della
variabile trasformata y :
µ (y ) = ln µ (x ) -
1
ln
2
σ 2 (x ) 

1 + 2 
µ (x) 

σ 2 (x ) 

σ 2 (y ) = l n  1 +

µ 2 (x) 

u = ay + b
variabile gaussiana standardizzata
u = a ln x + b
a=
1
σ (y)
b=-
µ (y )
σ (y)
0.002
0.0015
p(x)
µ(x) = 1000
σ(x) = 300
0.001
0.0005
0
0
1000
2000
x
Distribuzione lognormale
3000
4000
0,3
0,2
p(x)
a
0,1
b
0,0
0
10
20
30
40
x
Distribuzioni lognormali con uguale valore dello scarto quadratico
medio σ (y ) e diverso valore (maggiore per la distribuzione b ) della
media µ (y)
0,3
0,2
p(x)
a
0,1
b
0,0
0
10
20
30
40
x
Distribuzioni lognormali con uguale valore della media µ (y ) e diverso
valore (maggiore per la distribuzione b ) dello scarto quadratico
medio σ (y)
Distribuzione lognormale a tre parametri
y = ln (x - x 0)
variabile
µ (y)
x0
trasformata
Parametri:
σ (y)
u = a ln (x - x 0) + b
variabile gaussiana standardizzata
Le distribuzioni di Pearson
La funzione di densità di probabilità p ( x ) è una soluzione
dell'equazione differenziale
dp(x)
x -a
=
p (x )
dx
bx2 + cx + d
Esistono sei diversi tipi di leggi di Pearson.
La distribuzione Gamma a due parametri
p (x) =
α γ x γ -1 e - α x
Γ (γ)
La distribuzione della variabile x è limitata inferiormente e illimitata
superiormente.
Il limite inferiore è uguale a zero.
La distribuzione della variabile x non è simmetrica.
y = αx
variabile
trasformata
x
Γ i( y ;γ )
α γ x γ- 1 e -α x
P (x ) = ⌠
dx =

Γ (γ)
Γ (γ)
⌡
0
y
Γ i (y ; γ ) =
∫ e -tt γ - 1 d t
funzione Gamma incompleta
0
∞
Γ (γ) =
∫ e -t t γ - 1 dt
= Γ i( ∞ ; γ )
funzione Gamma completa
0
Relazioni tra la media e la varianza della variabile x e i due parametri α
eγ:
α =
γ=
µ (x)
1
=
σ 2 (x) σ (x)CV(x)
µ 2 (x )
1
=
2
σ (x) CV 2 (x)
0,3
0,2
p(x)
a
b
0,1
0,0
0
10
20
30
40
x
Funzioni di densità di probabilità di due distribuzioni Gamma (a due
parametri) con diverso valore (maggiore per la distribuzione b ) del
parametro γ e uguale valore del parametro α
0,3
0,2
p(x)
a
0,1
b
0,0
0
10
20
30
40
x
Funzioni di densità di probabilità di due distribuzioni Gamma (a due
parametri) con diverso valore (maggiore per la distribuzione a ) del
parametro α e uguale valore del parametro γ
La distribuzione Gamma a tre parametri
p (x ) =
α γ (x - x 0 ) γ - 1 e - α (x -x 0 )
Γ (γ)
La distribuzione della variabile x è limitata inferiormente e illimitata
superiormente.
Il limite inferiore è uguale al parametro x 0 .
La distribuzione della variabile x non è simmetrica.
La trasformazione logaritmica della
Gamma (distribuzione log-Gamma)
y = ln x
variabile
distribuzione
trasformata
La variabile trasformata y si assume distribuita secondo la legge
Gamma a tre parametri.
p (x ) =
α γ ( l n x - l n x 0 ) γ - 1 (x 0 /x ) α
x Γ (γ)
x
α γ ( l n x - l n x 0 ) γ - 1 ( x 0 /x ) α
P (x ) = ⌠
dx

x Γ (γ)
⌡
x0
Negli Stati Uniti è raccomandato l'uso della distribuzione log-Gamma
per l'analisi dei massimi annuali delle portate di piena.
La distribuzione del massimo valore in un campione
P(x)
distribuzione di probabilità originaria
P N(x) distribuzione di probabilità del massimo in un campione di
dimensione N (gli elementi sono estratti dalla popolazione della x
indipendentemente l'uno dall'altro)
Per l'assioma della probabilità composta è
P N (x) = P(x) N
Esempio
Funzioni di densità di probabilità della distribuzione originaria (a ) ,
della distribuzione del massimo valore in un campione di 10 elementi
(b ) e della distribuzione del massimo valore in un campione di 100
elementi (c)
0,4
c
0,3
p(x)
b
a
0,2
0,1
0,0
0
10
x
20
La distribuzione asintotica del massimo valore del I
tipo o distribuzione di Gumbel
Distribuzione asintotica del massimo valore:
lim P N (x)
N→ ∞
Distribuzione asintotica del massimo valore del I tipo o distribuzione di
Gumbel (valida per le distribuzioni originarie di tipo esponenziale):
P (x ) = e - e - α (x
- u)
p ( x ) = α e - e -α (x
y = α (x - u )
- u ) - α (x - u )
variabile ridotta
P (y ) = e -e -y
µ (y) = γ (costante di Eulero) ≅ 0 , 5 7 7 2
σ (y ) = \ S \ D O 2 ( \ F ( π ; \ R ( 6))) ≅ 1 , 2 8 3
Relazioni tra media e scarto quadratico medio della variabile x e
parametri della distribuzione di Gumbel:
α=
1,283
σ (x)
u = µ (x ) - 0 , 4 5 0 σ (x )
0.0150
u = 85
0.0100
α = 0,030
p(x)
α = 0,040
0.0050
0.0000
-100
0
100
200
300
400
x
Funzioni di densità di probabilità di due distribuzioni di
Gumbel, con diverso valore del parametro α e uguale
valore del parametro u
500
600