FACOLTA’ DI INGEGNERIA Laurea Specialistica in Ingegneria Civile N.O. Giuseppe T. Aronica CORSO DI IDROLOGIA TECNICA PARTE II Analisi e previsione statistica delle variabili idrologiche Lezione VIII: Funzioni di distribuzione di probabilità (1) 2 Analisi e previsione statistica delle variabili idrologiche Probabilità Funzioni di probabilità G.T. Aronica, IDROLOGIA TECNICA La funzione p(x), che associa a ogni valore della variabile casuale x la probabilità corrispondente, si chiama funzione (o distribuzione) di probabilità di x. p(x) = Pr[ X = x ] Proprietà ∑ p(x) = 1 0 ≤ p(x) ≤ 1 pmf (variabili discrete) 3 Analisi e previsione statistica delle variabili idrologiche Probabilità Funzioni di probabilità G.T. Aronica, IDROLOGIA TECNICA Nel caso di variabili continue si introduce la funzione P(x) funzione di probabilità di non superamento di x, che associa a ogni valore della variabile casuale x la probabilità che la variabile venga raggiunta e non superata. P(x) = Pr[ X ≤ x ] P(x) = ∑ p(X) X≤ x cdf (variabili continue) cdf (variabili discrete) Probabilità di superamento di x 1 − P(x) = Pr[ X > x ] 0 ≤ P(x) ≤ 1 4 Analisi e previsione statistica delle variabili idrologiche Probabilità Densità di probabilità Nel caso di variabile continua si osserva che G.T. Aronica, IDROLOGIA TECNICA p( x ) ≥ 0 x2 Pr[x1 ≤ X ≤ x 2 ] = ∫ p( x ) ⋅ dx x1 misura la probabilità che la variabile assuma un valore compreso tra (x1, x2). La funzione p(x) prende il nome di densità di probabilità (pdf) Dalla definizione di probabilità +∞ ∫ p( x ) = 1 −∞ l’area sottesa dalla pdf è sempre uguale a uno 5 Analisi e previsione statistica delle variabili idrologiche Probabilità Densità di probabilità P(x) = Pr[ X ≤ x ] cdf (variabili continue) G.T. Aronica, IDROLOGIA TECNICA Dalla definizione di pdf x P(x) = ∫ p( z) ⋅ dz −∞ misura la probabilità che la variabile sia minore uguale a x Ne consegue: dP(x) p(x) = dx La densità di probabilità (pdf) è la derivata della funzione di probabilità di non superamento (cdf) Analisi e previsione statistica delle variabili idrologiche 6 Grandezze caratteristiche delle PDF Momento di ordine r rispetto al valore x0 N N µr ( x ) = ∑ ( xi − x 0 )r ⋅ p( xi ) σ ( x ) = ∑ ( xi − µ( x ))2 ⋅ p( xi ) µr ( x ) = ∫ ( x − x 0 )r ⋅ p( xi ) ⋅ dx σ2 ( x ) = ∫ ( x − µ( x ))2 ⋅ p( xi ) ⋅ dx i=1 +∞ G.T. Aronica, IDROLOGIA TECNICA Varianza −∞ Media o valore atteso della variabile N µ( x ) = E[x ] = ∑ xi ⋅ p( xi ) i=1 +∞ µ( x ) = E[x ] ∫ x ⋅ p( xi ) ⋅ dx −∞ 2 i=1 +∞ −∞ Moda ( x = max [p( x )] Mediana ~ x = P( x )x =0.5 Analisi e previsione statistica delle variabili idrologiche 7 Grandezze caratteristiche delle PDF Coefficiente di variazione CV = σ µ G.T. Aronica, IDROLOGIA TECNICA Coefficiente di asimmetria γ1 γ1 = µ3 µ = 3 3 µ32 σ Coefficiente di kurtosi γ2 γ2 = µ4 µ2 2 8 Analisi e previsione statistica delle variabili idrologiche Il tempo di ritorno Nelle applicazioni pratiche delle elaborazioni statistiche è opportuno esprimere il grado di rarità di un evento in termini che presentino una maggiore comprensione rispetto alla probabilità di non superamento. P(x) probabilità di non superamento G.T. Aronica, IDROLOGIA TECNICA 1-P(x) probabilità di superamento Il superamento della grandezza x in N anni sarà pari a: N[1-P(x)] Si definisce tempo di ritorno T di una variabile idrologica x il numero medio di anni in cui la variabile viene raggiunta o superata mediamente una sola volta T[1-P(x)]= 1 T= 1 1 − P( x ) 9 Analisi e previsione statistica delle variabili idrologiche Il quantile Probabilità G.T. Aronica, IDROLOGIA TECNICA Si definisce quantile (o frattile) il valore della variabile x di fissata probabilità valore probabile = f(valori passati) Inferenza statistica su un campione della variabile Analisi statistica della grandezza x 10 Analisi e previsione statistica delle variabili idrologiche L’inferenza statistica G.T. Aronica, IDROLOGIA TECNICA Il problema dell’inferenza statistica si traduce nella ricerca della distribuzione di probabilità (CDF) più adatta a descrive le statistiche della variabile in esame Distribuzioni di probabilità di interesse idrologico (di variabili continue, illimitate superiormente) 1. Esponenziale 2. Normale (Gaussiana) 3. Log-normale 2 parametri (LN2) 4. Distribuzioni asintotiche del massimo valore (Gumbel, GEV, TCEV) 11 Analisi e previsione statistica delle variabili idrologiche Le distribuzioni di probabilità La distribuzione esponenziale Distribuzione continua a 1 parametro λ, limitata inferiormente ed illimitata superiormente 0.2 PDF Statistici della distribuzione µ( x ) = E[ x ] = σ( x ) = 1 λ2 1 λ 0.8 0.12 0.5 0.08 0.3 0.04 0 0.0 0 5 10 15 x 20 25 P(x) p( x ) = λ ⋅ e − λx 0.16 p(x) G.T. Aronica, IDROLOGIA TECNICA P(x) = 1 − e − λx CDF 1.0 Analisi e previsione statistica delle variabili idrologiche 12 Le distribuzioni di probabilità La distribuzione Normale o Gaussiana Distribuzione continua a 2 parametro µ e σ, illimitata inferiormente ed superiormente 1 x − µ 2 1 P(x) = ∫ ⋅ exp− dx CDF 2 2 σ π σ −∞ PDF 0.2 1 x − µ 2 1 p(x) = exp − 2 σ 2π σ 1 µ = 10 σ = 2.5 0.16 µ = 10 σ = 2.5 0.75 P(x) 0.12 p(x) G.T. Aronica, IDROLOGIA TECNICA x 0.08 0.5 0.25 0.04 0 0 0 5 10 x 15 20 0 5 10 15 x La distribuzione è simmetrica, media, moda e mediana coincidono 20 13 Analisi e previsione statistica delle variabili idrologiche Le distribuzioni di probabilità G.T. Aronica, IDROLOGIA TECNICA La distribuzione Normale o Gaussiana µ(x) parametro di posizione σ(x) parametro di forma Analisi e previsione statistica delle variabili idrologiche 14 Le distribuzioni di probabilità La distribuzione Normale o Gaussiana In forma ridotta o standardizzata Viene introdotta per sganciarsi dalla media e dallo scarto Variabile ridotta p(u) = p(x)σ(x) u2 1 p(u) = exp − 2π 2 u2 1 P(u) = ∫ ⋅ exp − du − ∞ 2π 2 1 0.4 µ=0 σ=1 µ=0 σ=1 0.32 P(u) = P(x) Si dimostra facilmente che: u P(x) 0.24 p(x) G.T. Aronica, IDROLOGIA TECNICA x − µ u= σ 0.75 0.5 0.16 0.25 0.08 0 -5 -3 0 -1 1 x 3 5 -5 -3 -1 1 x 3 5 15 Analisi e previsione statistica delle variabili idrologiche Le distribuzioni di probabilità Il teorema del limite centrale Se xi, i=1,2,..N, sono variabili aleatorie indipendenti e distribuite con qualsivoglia distribuzione di probabilità, allora la variabile: G.T. Aronica, IDROLOGIA TECNICA N z = ∑ xi i=1 tende a essere distribuita con legge normale quando N tende a infinito Proprietà della distribuzione normale Una trasformazione lineare y = a+bx di una variabile x distribuita normalmente con media µ e scarto σ è anch’essa distribuita normalmente con media a+bµ e bσ