Distribuzioni limite La distribuzione normale Si consideri una variabile casuale rappresentata mediante una combinazione lineare di altre variabili casuali e che di tale variabile casuale si voglia determinare la distribuzione di probabilità Teorema del limite centrale “Sotto condizioni molto generali, man mano che il numero delle variabili presenti nella sommatoria diventa grande, la distribuzione della variabile somma si avvicina sempre più alla distribuzione normale”. Oss.: Il teorema vale in “condizioni molto generali” ovvero se (1) le variabili considerate nella sommatoria sono indipendenti e ugualmente distribuite, (2) se le variabili sono indipendenti e diversamente distribuite. Il termine “si avvicina” non va inteso nel senso matematico di limite ma è più opportuno leggerlo come “viene approssimata da”. Infine, il termine “grande” dipende dalla bontà dell’approssimazione richiesta e dalla natura delle distribuzioni delle variabili presenti nella somma. Distribuzioni limite La distribuzione normale 2 x m 1 1 X fX ( x ) exp - 2 σ σ X 2π X FX ( x ) P X x x f X ( x )dx x Distribuzioni limite La distribuzione normale Variabile standardizzata u x mX σX xm x mX X FU FX ( x ) P X x P U FU u σ σ X X Modello limite dell’operatore valore estremo Sia Z la variabile massimo di n variabili casuali Xi Z max X1 ,..... X n La sua funzione di probabilità cumulata è: FZ ( z ) PZ z P tutte le X i z i 1,2,...,n Se tutte le Xi sono indipendenti: FZ ( z ) P X1 z P X 2 z ... P X n z FX ( z ) FX ( z ) .... FX ( z ) 1 2 n Modello limite dell’operatore valore estremo Nel caso in cui tutte le Xi abbiano la medesima distribuzione di probabilità, si ha: FZ ( z ) FX ( z ) n n 1 d f Z ( z ) FZ ( z ) n FX ( z ) f X ( z ) dz La distribuzione di Gumbel Da prima: Se le variabili Xi sono a) indipendenti fra di loro b) ugualmente distribuite e se (c) n tende all’infinito (d) la coda della distribuzione di probabilità cumulata della generica Xi può essere approssimata dalla seguente legge: FX x 1 e g x con g(x) monotona crescente, allora: z u FZ z exp exp z 0 La distribuzione di Gumbel mZ u 0,5772 2 2 2 Z 6 La media e la varianza della popolazione si stimano con la media e la varianza campionaria mˆ Z z 1 N ˆ Z2 sZ2 1 2 z z i N 1 z i Sostituendo le stime della media e della varianza della popolazione nel sistema è possibile stimare i coefficienti u e . La variabile ridotte di Gumbel Sia: Y Z u g Z Ne segue che la distribuzione di probabilità cumulata di Y è: FY y FZ g 1 y dove g 1 y y u Pertanto: g 1 y u FY y exp exp exp exp y La variabile ridotte di Gumbel Da questo segue: Y ln ln FY y Ma essendo FY y 1 1 Y ln ln 1 T 1 T Il piano di Gumbel Quindi: z u y 1 Y ln ln 1 T z z u y u y 0 2 2 6 4 10 50 100 T F Pertanto nel piano di Gumbel la variabile Z è legata alla variabile ridotta Y da una legge lineare che mostra u come intercetta (parametro di posizione) e come parametro che ne descrive la pendenza (parametro di scala). Il piano di Gumbel 20000 z u y 18000 16000 Q (m3/s) 14000 12000 10000 8000 6000 4000 Qmax 2000 0 EV1 2 5 10 20 T (years) 50 100 200 500 1000 Plotting position Per riportare i punti campionari nel piano di Gumbel si procede nel seguente modo: Si ordina il campione in modo crescente Si stima la frequenza campionaria con una formula del tipo: ia ˆ Fi N b dove N è il numero dei dati che compongono il campione a e b variano a seconda della formula: nel caso di Gringorten a= 0,44 e b=0,12 i è la posizione del i-esimo valore nel campione ordinato Si associa la frequenza campionaria stimata alla variabile ridotta di Gumbel nel seguente modo: yi ln ln Fˆi Plotting position yi ln ln Fˆi Si formano le coppie xi,yi dove xi è il valore numerico del dato campionario che occupata la i-esima posizione nel campione ordinato in modo crescente 20000 18000 16000 Q (m3/s) 14000 12000 10000 8000 6000 4000 Qmax 2000 0 EV1 2 5 10 20 T (years) 50 100 200 500 1000 La distribuzione EV2 Z2 max X1 ,..... X n Le variabili Xi sono a) indipendenti fra di loro b) ugualmente distribuite e se (c) n tende all’infinito (d) la coda della distribuzione di probabilità cumulata della generica Xi può essere approssimata dalla seguente legge: 1 k x FX x 1 ; k 0, x x0 x0 allora: 1 k z2 u FZ2 z2 exp 1 k k 0, 0 u z2 k La distribuzione EV2 Riportiamo la distribuzione EV2 sul piano di Gumbel Introduco una prima variabile ridotta: Y2 Z2 u 1 k g Z2 u k k Z2 Y2 g 1 Y2 1 k z u 2 Da prima: FZ2 z2 exp 1 k quindi: 1 1 k FY2 y2 FZ2 g y2 exp y2 La distribuzione EV2 Y2 Però non è ancora la variabile ridotta di Gumbel Introduco una seconda variabile ridotta: 1 Y1 ln Y2 g Y2 k Y2 e kY1 g 1 Y1 FY1 y1 FY2 g 1 y1 e 1 ky1 e k e e y1 La distribuzione EV2 z2 u z k k y2 u k k 1 e ky1 z2 u k z1 u y u y 0 2 2 6 4 10 50 100 T F Poiché k<0 la curva Z2=f(Y1) ha una concavità rivolta verso l’alto e andamento esponenziale e ky1 La distribuzione EV2 E Y2 my2 (1 k ) Var Y2 E Y2 2 E 2 Y2 (1 2k ) 2 (1 k ) y 2 3 E Y2 E Y2 E Y E Y 2 2 2 3/ 2 E Y23 3E Y2 2 E Y2 2 E 3 Y2 3/ 2 2 E Y2 E Y2 (1 3k ) 3(1 2k )(1 k ) 2 3 (1 k ) (1 2k ) (1 k ) 2 3/ 2 La distribuzione EV2 Essendo z2 u k k y2 Si ha: E Z 2 mz 2 u Var Z 2 z y 2 2 2 k 2 k Var Y2 k m y2 La distribuzione EV2 Operativamente 1 z2 z2,i n E Z 2 mz 2 u 2 1 s z2,i z2 n 1 z 2 n2 M 3 g n 1 n 2 s 3 Var Z 2 y 2 1 M 3 z2,i z2 n 2 k 2 k k m y2 Var Y2 (1 3k ) 3(1 2k )(1 k ) 23 (1 k ) (1 2k ) 2 (1 k ) u 3/ 2 k La distribuzione EV3 Z3 max X1 ,..... X n Le variabili Xi sono a) indipendenti fra di loro b) ugualmente distribuite e se (c) n tende all’infinito (d) la coda della distribuzione di probabilità cumulata della generica Xi può essere approssimata dalla seguente legge: 1 k FX x 1 c x x0 ; k 0, x x0 allora: 1 k z u FZ3 z3 exp 1 k 3 k 0, 0 z3 u k La distribuzione EV3 Riportiamo la distribuzione EV3 sul piano di Gumbel Introduco una prima variabile ridotta: Y2 Z3 u 1 k g Z3 u Da prima: k k Z3 Y2 g 1 Y2 1 k z u FZ3 z3 exp 1 k 3 quindi: 1 1 k FY2 y2 FZ3 g y2 exp y2 La distribuzione EV2 Introduco una seconda variabile ridotta: 1 Y1 ln Y2 g Y2 k Y2 e kY1 g 1 Y1 FY1 y1 FY2 g 1 y1 e 1 ky1 e k e e y1 La distribuzione EV2 Z3 u z k k Y2 u k k e kY1 u z1 u y Z3 u u k kY1 1 e y 0 2 2 6 4 10 50 100 T F Poiché k>0 la curva Z3=f(Y1) ha una concavità rivolta verso il basso k kY1 1 e La distribuzione GEV 1/ k FZ z e z z u 1 k k 0 EV 1 EV 2 k 0 EV 2 EV1 u k 0 EV 3 EV 3 y 0 2 2 6 4 10 50 100 T F