La distribuzione normale o distribuzione di Gauss Gauss ha dimostrato che secondo questa legge si possono ritenere distribuiti gli errori accidentali di misura di una qualsivoglia grandezza. Densità di probabilità: p (x ) = 1 x - µ ( x ) 2 e x p 2 σ (x) 2 πσ (x) √ 1 Poichè la curva è simmetrica la media, la mediana e la moda coincidono tra loro. Cambiare il valore della media µ (x) equivale a fare scorrere lungo l'asse delle ascisse il grafico che rappresenta la densità di probabilità p(x). Cambiare il valore dello scarto quadratico medio σ (x ) equivale a cambiare la forma del grafico. Probabilità che la x sia contenuta in un certo intervallo: - intervallo [ µ (x ) - σ (x ), µ (x ) + σ (x )] → probabilità uguale a 0,683; - intervallo [ µ (x ) - 2 σ (x ), µ (x ) + 2 σ (x )] → probabilità uguale a 0,945; - intervallo [ µ (x ) - 3 σ (x ), µ (x ) + 3 σ (x )] → probabilità uguale a 0,997. 0.25 0.2 p(x) 0.15 0.1 σ(x) σ(x) 0.05 µ(x) 0 0 2 4 6 8 10 12 x Distribuzione di Gauss 14 16 18 20 0,200 p(x) a b 0,100 0,000 -10 0 10 20 30 40 x Funzioni di densità di probabilità di due distribuzioni normali con diverso valore della media µ (x ) (10 per la distribuzione a e 20 per la distribuzione b) e uguale valore (2,5) dello scarto quadratico medio σ (x) 0,200 p(x) a 0,100 b 0,000 -10 0 10 20 30 40 x Funzioni di densità di probabilità di due distribuzioni normali con uguale valore (10) della media µ (x ) e diverso valore dello scarto quadratico medio σ ( x ) (2,5 per la distribuzione a e 5 per la distribuzione b) Il teorema del limite centrale N variabili casuali indipendenti x 1 , x 2 , ..., x N variabile casuale → N z= ∑xi i= 1 La distribuzione della variabile z tende a essere normale, al tendere di N a infinito, quali che siano le funzioni di probabilità delle variabili originarie. La distribuzione normale in forma canonica x ∫p(x)dx P (x ) = -∞ x 1 1 x - µ ( x ) 2 P (x ) = ⌠ e x p dx 2 σ (x) 2 πσ (x) ⌡√ -∞ La funzione non è integrabile analiticamente: P (x) si deve calcolare per mezzo di un procedimento numerico approssimato. In passato i valori della probabilità P (x) erano tabulati. Oggi si calcolano per mezzo di un codice di calcolo automatico. u= x - µ (x ) σ (x) variabile ridotta o standardizzata P (u) = P (x) p(u) = p(x) dx = σ (x ) du probabilità di non superamento dx du → p(u) = p(x) σ (x) p (u ) = u2 e x p 2 2 π √ densità di probabilità µ (u ) = µ (x ) - µ (x ) = 0 σ (x) σ (u) = 1 σ (x) = 1 σ (x) Funzione di probabilità della distribuzione di Gauss. Valori della variabile ridotta u in funzione di quelli della probabilità di non superamento P . P u .5000 .0000 .5050 .0125 .5100 .0250 .5150 .0375 .5200 .0500 .5250 .0625 .5300 .0751 .5350 .0876 .5400 .1002 .5450 .1128 P u .5500 .1254 .5550 .1380 .5600 .1507 .5650 .1633 .5700 .1760 .5750 .1888 .5800 .2015 .5850 .2143 .5900 .2271 .5950 .2400 P u .6000 .2529 .6050 .2659 .6100 .2789 .6150 .2919 .6200 .3050 .6250 .3182 .6300 .3314 .6350 .3447 .6400 .3580 .6450 .3714 P u .6500 .3849 .6550 .3984 .6600 .4120 .6650 .4257 .6700 .4395 .6750 .4533 .6800 .4673 .6850 .4813 .6900 .4954 .6950 .5097 P u .7000 .5240 .7050 .5384 .7100 .5530 .7150 .5677 .7200 .5825 .7250 .5974 .7300 .6125 .7350 .6277 .7400 .6430 .7450 .6585 P u .7500 .6742 .7550 .6900 .7600 .7060 .7650 .7222 .7700 .7386 .7750 .7552 .7800 .7720 .7850 .7890 .7900 .8062 .7950 .8237 P u .8000 .8415 .8050 .8595 .8100 .8778 .8150 .8964 .8200 .9153 .8250 .9345 .8300 .9541 .8350 .9741 .8400 .8450 .9944 1.0152 P u .8500 .8550 1.0364 1.0581 .8600 .8650 1.0804 1.1031 .8700 .8750 1.1265 1.1504 .8800 .8850 1.1751 1.2005 .8900 .8950 1.2267 1.2537 P u .9000 .9050 1.2817 1.3108 .9100 .9150 1.3410 1.3724 .9200 .9250 1.4053 1.4398 .9300 .9350 1.4761 1.5144 .9400 .9450 1.5551 1.5985 P u .9500 .9550 1.6452 1.6958 .9600 .9650 1.7511 1.8123 .9700 .9750 1.8812 1.9604 .9800 .9850 2.0542 2.1705 .9900 .9950 2.3268 2.5762 P u .9900 .9910 2.3268 2.3661 .9920 .9930 2.4093 2.4577 .9940 .9950 2.5126 2.5762 .9960 .9970 2.6525 2.7481 .9980 .9990 2.8785 3.0905 P u .9990 .9991 3.0905 3.1217 .9992 .9993 3.1562 3.1949 .9994 .9995 3.2391 3.2908 .9996 .9997 3.3530 3.4319 .9998 .9999 3.5404 3.7194 (A causa della simmetria della distribuzione non sono tabulati i valori negativi della variabile ridotta.) Approssimazione numerica della distribuzione di Gauss per u ≥ 0 p (u ) = funzione di probabilità u2 e x p 2 2π √ 1 u P (u ) = ∫ p(u)d u - ∞ r b1 b2 b3 b4 b5 = = = = = = f = 0,2316419 0,31938153 -0,356563782 1,781477937 -1,821255978 1,330274429 u2 e x p 2 2π √ 1 t = 1 1 + ru P ( u ) ≅ 1 - f( b 1 t + b 2 t 2 + b 3 t 3 + b 4 t 4 + b 5 t 5 ) della Approssimazione numerica dell'inversa della funzione probabilità della distribuzione di Gauss per P ≥ 0,5 u P (u ) = ∫ p(u)d u - ∞ c0 c1 c2 d1 d2 d3 = = = = = = t= 2,515517 0,802853 0,010328 1,432788 0,189269 0,001308 √ ln 1 ( 1 - P )2 u ≅ t - \ S \ D O 3 ( \ F ( c 0 + c 1 t + c 2 t2 ; 1 + d 1 t + d 2 t2 + d 3 t3 )) . di Distribuzione di Gauss - Esempi di calcolo ________________________________________________________ Parametri della distribuzione: µ (x) = 5 0 0 σ (x) = 1 0 0 ________________________________________________________ Determinazione della probabilità di non superamento P(x) di un valore della x assegnato: x = 650 u = (650 - 500)/100 = 1 , 5 u → P(u) (codice di calcolo o tabella) P (u) = 0,9332 P(x) = P(u) P (x) = 0 , 9 3 3 2 ________________________________________________________ Determinazione del valore della variabile x con probabilità di non superamento P(x) assegnata: P (x) = 0 , 8 P (u) = P (x) P (u) = 0 , 8 P(u) → u (codice di calcolo o tabella) u = 0,8415 x = µ (x ) + u σ (x ) = 5 0 0 + 0 , 8 4 1 5 × 1 0 0 = 5 8 4 , 1 5 Distribuzione lognormale a due parametri y = ln x p (x ) = variabile trasformata 1 l n x - µ ( y ) 2 e x p σ (y) 2 x√ 2 πσ (y) 1 La distribuzione della x è limitata inferiormente e ha come limite zero. La distribuzione della variabile originaria x non è simmetrica. Relazioni tra media e varianza della variabile originaria x e della variabile trasformata y : µ (y ) = ln µ (x ) - 1 ln 2 σ 2 (x ) 1 + 2 µ (x) σ 2 (x ) σ 2 (y ) = l n 1 + µ 2 (x) u = ay + b variabile gaussiana standardizzata u = a ln x + b a= 1 σ (y) b=- µ (y ) σ (y) 0.002 0.0015 p(x) µ(x) = 1000 σ(x) = 300 0.001 0.0005 0 0 1000 2000 x Distribuzione lognormale 3000 4000 0,3 0,2 p(x) a 0,1 b 0,0 0 10 20 30 40 x Distribuzioni lognormali con uguale valore dello scarto quadratico medio σ (y ) e diverso valore (maggiore per la distribuzione b ) della media µ (y) 0,3 0,2 p(x) a 0,1 b 0,0 0 10 20 30 40 x Distribuzioni lognormali con uguale valore della media µ (y ) e diverso valore (maggiore per la distribuzione b ) dello scarto quadratico medio σ (y) Distribuzione lognormale a tre parametri y = ln (x - x 0) variabile µ (y) x0 trasformata Parametri: σ (y) u = a ln (x - x 0) + b variabile gaussiana standardizzata Le distribuzioni di Pearson La funzione di densità di probabilità p ( x ) è una soluzione dell'equazione differenziale dp(x) x -a = p (x ) dx bx2 + cx + d Esistono sei diversi tipi di leggi di Pearson. La distribuzione Gamma a due parametri p (x) = α γ x γ -1 e - α x Γ (γ) La distribuzione della variabile x è limitata inferiormente e illimitata superiormente. Il limite inferiore è uguale a zero. La distribuzione della variabile x non è simmetrica. y = αx variabile trasformata x Γ i( y ;γ ) α γ x γ- 1 e -α x P (x ) = ⌠ dx = Γ (γ) Γ (γ) ⌡ 0 y Γ i (y ; γ ) = ∫ e -tt γ - 1 d t funzione Gamma incompleta 0 ∞ Γ (γ) = ∫ e -t t γ - 1 dt = Γ i( ∞ ; γ ) funzione Gamma completa 0 Relazioni tra la media e la varianza della variabile x e i due parametri α eγ: α = γ= µ (x) 1 = σ 2 (x) σ (x)CV(x) µ 2 (x ) 1 = 2 σ (x) CV 2 (x) 0,3 0,2 p(x) a b 0,1 0,0 0 10 20 30 40 x Funzioni di densità di probabilità di due distribuzioni Gamma (a due parametri) con diverso valore (maggiore per la distribuzione b ) del parametro γ e uguale valore del parametro α 0,3 0,2 p(x) a 0,1 b 0,0 0 10 20 30 40 x Funzioni di densità di probabilità di due distribuzioni Gamma (a due parametri) con diverso valore (maggiore per la distribuzione a ) del parametro α e uguale valore del parametro γ La distribuzione Gamma a tre parametri p (x ) = α γ (x - x 0 ) γ - 1 e - α (x -x 0 ) Γ (γ) La distribuzione della variabile x è limitata inferiormente e illimitata superiormente. Il limite inferiore è uguale al parametro x 0 . La distribuzione della variabile x non è simmetrica. La trasformazione logaritmica della Gamma (distribuzione log-Gamma) y = ln x variabile distribuzione trasformata La variabile trasformata y si assume distribuita secondo la legge Gamma a tre parametri. p (x ) = α γ ( l n x - l n x 0 ) γ - 1 (x 0 /x ) α x Γ (γ) x α γ ( l n x - l n x 0 ) γ - 1 ( x 0 /x ) α P (x ) = ⌠ dx x Γ (γ) ⌡ x0 Negli Stati Uniti è raccomandato l'uso della distribuzione log-Gamma per l'analisi dei massimi annuali delle portate di piena. La distribuzione del massimo valore in un campione P(x) distribuzione di probabilità originaria P N(x) distribuzione di probabilità del massimo in un campione di dimensione N (gli elementi sono estratti dalla popolazione della x indipendentemente l'uno dall'altro) Per l'assioma della probabilità composta è P N (x) = P(x) N Esempio Funzioni di densità di probabilità della distribuzione originaria (a ) , della distribuzione del massimo valore in un campione di 10 elementi (b ) e della distribuzione del massimo valore in un campione di 100 elementi (c) 0,4 c 0,3 p(x) b a 0,2 0,1 0,0 0 10 x 20 La distribuzione asintotica del massimo valore del I tipo o distribuzione di Gumbel Distribuzione asintotica del massimo valore: lim P N (x) N→ ∞ Distribuzione asintotica del massimo valore del I tipo o distribuzione di Gumbel (valida per le distribuzioni originarie di tipo esponenziale): P (x ) = e - e - α (x - u) p ( x ) = α e - e -α (x y = α (x - u ) - u ) - α (x - u ) variabile ridotta P (y ) = e -e -y µ (y) = γ (costante di Eulero) ≅ 0 , 5 7 7 2 σ (y ) = \ S \ D O 2 ( \ F ( π ; \ R ( 6))) ≅ 1 , 2 8 3 Relazioni tra media e scarto quadratico medio della variabile x e parametri della distribuzione di Gumbel: α= 1,283 σ (x) u = µ (x ) - 0 , 4 5 0 σ (x ) 0.0150 u = 85 0.0100 α = 0,030 p(x) α = 0,040 0.0050 0.0000 -100 0 100 200 300 400 x Funzioni di densità di probabilità di due distribuzioni di Gumbel, con diverso valore del parametro α e uguale valore del parametro u 500 600