"la distribuzione" probabilità

annuncio pubblicitario
FACOLTA’ DI INGEGNERIA
Laurea Specialistica in Ingegneria Civile N.O.
Giuseppe T. Aronica
CORSO DI IDROLOGIA TECNICA
PARTE II
Analisi e previsione statistica delle
variabili idrologiche
Lezione VIII: Funzioni di distribuzione di probabilità (1)
2
Analisi e previsione statistica delle variabili
idrologiche
Probabilità
Funzioni di probabilità
G.T. Aronica, IDROLOGIA TECNICA
La funzione p(x), che associa a ogni valore della variabile casuale
x la probabilità corrispondente, si chiama funzione (o
distribuzione) di probabilità di x.
p(x) = Pr[ X = x ]
Proprietà
∑ p(x) = 1
0 ≤ p(x) ≤ 1
pmf (variabili discrete)
3
Analisi e previsione statistica delle variabili
idrologiche
Probabilità
Funzioni di probabilità
G.T. Aronica, IDROLOGIA TECNICA
Nel caso di variabili continue si introduce la funzione P(x)
funzione di probabilità di non superamento di x, che associa a
ogni valore della variabile casuale x la probabilità che la variabile
venga raggiunta e non superata.
P(x) = Pr[ X ≤ x ]
P(x) = ∑ p(X)
X≤ x
cdf (variabili continue)
cdf (variabili discrete)
Probabilità di superamento di x
1 − P(x) = Pr[ X > x ]
0 ≤ P(x) ≤ 1
4
Analisi e previsione statistica delle variabili
idrologiche
Probabilità
Densità di probabilità
Nel caso di variabile continua si osserva che
G.T. Aronica, IDROLOGIA TECNICA
p( x ) ≥ 0
x2
Pr[x1 ≤ X ≤ x 2 ] = ∫ p( x ) ⋅ dx
x1
misura la probabilità che la variabile assuma
un valore compreso tra (x1, x2).
La funzione p(x) prende il nome di densità di probabilità (pdf)
Dalla definizione di probabilità
+∞
∫ p( x ) = 1
−∞
l’area sottesa dalla pdf è sempre uguale a uno
5
Analisi e previsione statistica delle variabili
idrologiche
Probabilità
Densità di probabilità
P(x) = Pr[ X ≤ x ]
cdf (variabili continue)
G.T. Aronica, IDROLOGIA TECNICA
Dalla definizione di pdf
x
P(x) = ∫ p( z) ⋅ dz
−∞
misura la probabilità che la variabile sia minore
uguale a x
Ne consegue:
dP(x)
p(x) =
dx
La densità di probabilità (pdf) è la derivata della
funzione di probabilità di non superamento (cdf)
Analisi e previsione statistica delle variabili
idrologiche
6
Grandezze caratteristiche delle PDF
Momento di ordine r rispetto al valore x0
N
N
µr ( x ) = ∑ ( xi − x 0 )r ⋅ p( xi )
σ ( x ) = ∑ ( xi − µ( x ))2 ⋅ p( xi )
µr ( x ) = ∫ ( x − x 0 )r ⋅ p( xi ) ⋅ dx
σ2 ( x ) = ∫ ( x − µ( x ))2 ⋅ p( xi ) ⋅ dx
i=1
+∞
G.T. Aronica, IDROLOGIA TECNICA
Varianza
−∞
Media o valore atteso della variabile
N
µ( x ) = E[x ] = ∑ xi ⋅ p( xi )
i=1
+∞
µ( x ) = E[x ] ∫ x ⋅ p( xi ) ⋅ dx
−∞
2
i=1
+∞
−∞
Moda
(
x = max [p( x )]
Mediana
~
x = P( x )x =0.5
Analisi e previsione statistica delle variabili
idrologiche
7
Grandezze caratteristiche delle PDF
Coefficiente di variazione
CV =
σ
µ
G.T. Aronica, IDROLOGIA TECNICA
Coefficiente di asimmetria γ1
γ1 =
µ3
µ
= 3
3
µ32 σ
Coefficiente di kurtosi γ2
γ2 =
µ4
µ2
2
8
Analisi e previsione statistica delle variabili
idrologiche
Il tempo di ritorno
Nelle applicazioni pratiche delle elaborazioni statistiche è opportuno
esprimere il grado di rarità di un evento in termini che presentino una
maggiore comprensione rispetto alla probabilità di non superamento.
P(x) probabilità di non superamento
G.T. Aronica, IDROLOGIA TECNICA
1-P(x) probabilità di superamento
Il superamento della grandezza x in N anni sarà pari a:
N[1-P(x)]
Si definisce tempo di ritorno T di una variabile idrologica x il numero
medio di anni in cui la variabile viene raggiunta o superata mediamente
una sola volta
T[1-P(x)]= 1
T=
1
1 − P( x )
9
Analisi e previsione statistica delle variabili
idrologiche
Il quantile
Probabilità
G.T. Aronica, IDROLOGIA TECNICA
Si definisce quantile (o frattile) il valore della
variabile x di fissata probabilità
valore probabile = f(valori passati)
Inferenza statistica su un campione della variabile
Analisi statistica della grandezza x
10
Analisi e previsione statistica delle variabili
idrologiche
L’inferenza statistica
G.T. Aronica, IDROLOGIA TECNICA
Il problema dell’inferenza statistica si traduce
nella ricerca della distribuzione di probabilità
(CDF) più adatta a descrive le statistiche
della variabile in esame
Distribuzioni di probabilità di interesse idrologico (di variabili
continue, illimitate superiormente)
1. Esponenziale
2. Normale (Gaussiana)
3. Log-normale 2 parametri (LN2)
4. Distribuzioni asintotiche del massimo valore (Gumbel, GEV,
TCEV)
11
Analisi e previsione statistica delle variabili
idrologiche
Le distribuzioni di probabilità
La distribuzione esponenziale
Distribuzione continua a 1 parametro λ, limitata inferiormente ed
illimitata superiormente
0.2
PDF
Statistici della distribuzione
µ( x ) = E[ x ] =
σ( x ) =
1
λ2
1
λ
0.8
0.12
0.5
0.08
0.3
0.04
0
0.0
0
5
10
15
x
20
25
P(x)
p( x ) = λ ⋅ e − λx
0.16
p(x)
G.T. Aronica, IDROLOGIA TECNICA
P(x) = 1 − e − λx CDF
1.0
Analisi e previsione statistica delle variabili
idrologiche
12
Le distribuzioni di probabilità
La distribuzione Normale o Gaussiana
Distribuzione continua a 2 parametro µ e σ, illimitata inferiormente
ed superiormente
 1  x − µ 2 
1
P(x) = ∫
⋅ exp− 
  dx CDF
2
2
σ
π
σ

 

−∞
PDF
0.2
 1  x − µ 2 
1
p(x) =
exp − 
 
2
σ 2π
σ

 

1
µ = 10
σ = 2.5
0.16
µ = 10
σ = 2.5
0.75
P(x)
0.12
p(x)
G.T. Aronica, IDROLOGIA TECNICA
x
0.08
0.5
0.25
0.04
0
0
0
5
10
x
15
20
0
5
10
15
x
La distribuzione è simmetrica, media, moda e mediana coincidono
20
13
Analisi e previsione statistica delle variabili
idrologiche
Le distribuzioni di probabilità
G.T. Aronica, IDROLOGIA TECNICA
La distribuzione Normale o Gaussiana
µ(x) parametro di posizione
σ(x) parametro di forma
Analisi e previsione statistica delle variabili
idrologiche
14
Le distribuzioni di probabilità
La distribuzione Normale o Gaussiana
In forma ridotta o standardizzata
Viene introdotta per sganciarsi dalla media e dallo scarto
Variabile ridotta
p(u) = p(x)σ(x)
 u2 
1
p(u) =
exp − 


2π
 2
 u2 
1
P(u) = ∫
⋅ exp − du


− ∞ 2π
 2
1
0.4
µ=0
σ=1
µ=0
σ=1
0.32
P(u) = P(x)
Si dimostra facilmente che:
u
P(x)
0.24
p(x)
G.T. Aronica, IDROLOGIA TECNICA
 x − µ
u=

 σ 
0.75
0.5
0.16
0.25
0.08
0
-5
-3
0
-1
1
x
3
5
-5
-3
-1
1
x
3
5
15
Analisi e previsione statistica delle variabili
idrologiche
Le distribuzioni di probabilità
Il teorema del limite centrale
Se xi, i=1,2,..N, sono variabili aleatorie indipendenti e distribuite con
qualsivoglia distribuzione di probabilità, allora la variabile:
G.T. Aronica, IDROLOGIA TECNICA
N
z = ∑ xi
i=1
tende a essere distribuita con legge normale quando N tende a infinito
Proprietà della distribuzione normale
Una trasformazione lineare y = a+bx di una variabile x distribuita
normalmente con media µ e scarto σ è anch’essa distribuita normalmente
con media a+bµ e bσ
Scarica