Distribuzioni limite  La distribuzione normale Si consideri una variabile casuale rappresentata mediante una combinazione lineare di altre variabili casuali e che di tale variabile casuale si voglia determinare la distribuzione di probabilità Teorema del limite centrale “Sotto condizioni molto generali, man mano che il numero delle variabili presenti nella sommatoria diventa grande, la distribuzione della variabile somma si avvicina sempre più alla distribuzione normale”. Oss.: Il teorema vale in “condizioni molto generali” ovvero se (1) le variabili considerate nella sommatoria sono indipendenti e ugualmente distribuite, (2) se le variabili sono indipendenti e diversamente distribuite. Il termine “si avvicina” non va inteso nel senso matematico di limite ma è più opportuno leggerlo come “viene approssimata da”. Infine, il termine “grande” dipende dalla bontà dell’approssimazione richiesta e dalla natura delle distribuzioni delle variabili presenti nella somma. Distribuzioni limite  La distribuzione normale 2    x  m 1 1 X  fX ( x ) exp -   2 σ   σ X 2π   X   FX ( x )  P X  x  x  f X ( x )dx   x   Distribuzioni limite  La distribuzione normale Variabile standardizzata u x  mX σX   xm  x  mX  X   FU  FX ( x )  P X  x  P U   FU u  σ  σ X    X  Modello limite dell’operatore valore estremo Sia Z la variabile massimo di n variabili casuali Xi Z  max  X1 ,..... X n  La sua funzione di probabilità cumulata è: FZ ( z )  PZ  z  P tutte le X i  z i 1,2,...,n Se tutte le Xi sono indipendenti: FZ ( z )  P  X1  z  P  X 2  z  ... P  X n  z   FX ( z ) FX ( z ) .... FX ( z ) 1 2 n Modello limite dell’operatore valore estremo Nel caso in cui tutte le Xi abbiano la medesima distribuzione di probabilità, si ha: FZ ( z )  FX ( z ) n n 1 d f Z ( z )  FZ ( z )  n FX ( z ) f X ( z ) dz La distribuzione di Gumbel Da prima: Se le variabili Xi sono a) indipendenti fra di loro b) ugualmente distribuite e se (c) n tende all’infinito (d) la coda della distribuzione di probabilità cumulata della generica Xi può essere approssimata dalla seguente legge: FX  x   1  e  g  x con g(x) monotona crescente, allora:   z  u  FZ  z   exp   exp          z    0 La distribuzione di Gumbel  mZ  u  0,5772   2  2 2  Z  6  La media e la varianza della popolazione si stimano con la media e la varianza campionaria mˆ Z  z  1 N ˆ Z2  sZ2  1 2 z  z    i N 1 z i Sostituendo le stime della media e della varianza della popolazione nel sistema è possibile stimare i coefficienti u e . La variabile ridotte di Gumbel Sia: Y  Z u   g Z  Ne segue che la distribuzione di probabilità cumulata di Y è: FY  y   FZ  g 1  y   dove g 1  y    y  u Pertanto:   g 1  y   u   FY  y   exp   exp      exp   exp   y        La variabile ridotte di Gumbel Da questo segue:  Y   ln  ln  FY  y   Ma essendo  FY  y   1    1  Y   ln   ln 1     T   1 T Il piano di Gumbel Quindi: z  u  y   1  Y   ln   ln 1     T   z z  u  y u y 0 2 2 6 4 10 50 100 T F Pertanto nel piano di Gumbel la variabile Z è legata alla variabile ridotta Y da una legge lineare che mostra u come intercetta (parametro di posizione) e  come parametro che ne descrive la pendenza (parametro di scala). Il piano di Gumbel 20000 z  u  y 18000 16000 Q (m3/s) 14000 12000 10000 8000 6000 4000 Qmax 2000 0 EV1 2 5 10 20 T (years) 50 100 200 500 1000 Plotting position Per riportare i punti campionari nel piano di Gumbel si procede nel seguente modo: Si ordina il campione in modo crescente Si stima la frequenza campionaria con una formula del tipo: ia ˆ Fi  N b dove N è il numero dei dati che compongono il campione a e b variano a seconda della formula: nel caso di Gringorten a= 0,44 e b=0,12 i è la posizione del i-esimo valore nel campione ordinato Si associa la frequenza campionaria stimata alla variabile ridotta di Gumbel nel seguente modo:    yi   ln  ln Fˆi Plotting position    yi   ln  ln Fˆi Si formano le coppie xi,yi dove xi è il valore numerico del dato campionario che occupata la i-esima posizione nel campione ordinato in modo crescente 20000 18000 16000 Q (m3/s) 14000 12000 10000 8000 6000 4000 Qmax 2000 0 EV1 2 5 10 20 T (years) 50 100 200 500 1000 La distribuzione EV2 Z2  max  X1 ,..... X n  Le variabili Xi sono a) indipendenti fra di loro b) ugualmente distribuite e se (c) n tende all’infinito (d) la coda della distribuzione di probabilità cumulata della generica Xi può essere approssimata dalla seguente legge: 1 k  x FX  x   1    ; k  0, x  x0  x0  allora: 1   k z2  u       FZ2  z2   exp  1  k         k  0,   0  u   z2   k La distribuzione EV2 Riportiamo la distribuzione EV2 sul piano di Gumbel Introduco una prima variabile ridotta: Y2 Z2  u    1 k g Z2  u   k    k  Z2  Y2  g 1 Y2  1   k z  u     2   Da prima: FZ2  z2   exp  1  k         quindi: 1   1 k FY2  y2   FZ2  g  y2    exp  y2    La distribuzione EV2 Y2 Però non è ancora la variabile ridotta di Gumbel Introduco una seconda variabile ridotta: 1 Y1   ln Y2  g Y2  k Y2  e  kY1 g 1 Y1  FY1  y1   FY2  g 1  y1    e 1  ky1 e k e  e y1 La distribuzione EV2 z2  u  z  k   k y2  u   k   k  1  e ky1  z2  u      k  z1  u   y u y 0 2 2 6 4 10 50 100 T F Poiché k<0 la curva Z2=f(Y1) ha una concavità rivolta verso l’alto e andamento esponenziale e  ky1 La distribuzione EV2 E Y2   my2  (1  k ) Var Y2   E Y2 2   E 2 Y2   (1  2k )   2 (1  k ) y  2 3  E Y2  E Y2      E Y  E Y    2 2  2 3/ 2 E Y23   3E Y2 2  E Y2   2 E 3 Y2    3/ 2 2  E Y2  E Y2      (1  3k )  3(1  2k )(1  k )  2 3 (1  k )  (1  2k )   (1  k )  2 3/ 2  La distribuzione EV2 Essendo z2  u   k   k y2 Si ha: E  Z 2   mz 2  u  Var  Z 2   z y 2 2 2 k 2  k  Var Y2   k m y2 La distribuzione EV2 Operativamente 1 z2   z2,i n E  Z 2   mz 2  u  2 1 s z2,i  z2    n 1 z 2 n2 M 3 g  n  1 n  2  s 3 Var  Z 2   y  2 3 1 M 3    z2,i  z2  n 2 k 2  k   k m y2 Var Y2   (1  3k )  3(1  2k )(1  k )  23 (1  k )  (1  2k )  2 (1  k )  u 3/ 2 k La distribuzione EV3 Z3  max  X1 ,..... X n  Le variabili Xi sono a) indipendenti fra di loro b) ugualmente distribuite e se (c) n tende all’infinito (d) la coda della distribuzione di probabilità cumulata della generica Xi può essere approssimata dalla seguente legge: 1 k FX  x   1  c  x  x0  ; k  0, x  x0 allora: 1   k z  u      FZ3  z3   exp   1  k 3         k  0,   0   z3  u   k La distribuzione EV3 Riportiamo la distribuzione EV3 sul piano di Gumbel Introduco una prima variabile ridotta: Y2 Z3  u    1 k g  Z3  u  Da prima:  k   k  Z3  Y2  g 1 Y2  1   k z  u      FZ3  z3   exp   1  k 3         quindi: 1   1 k FY2  y2   FZ3  g  y2    exp  y2    La distribuzione EV3 Introduco una seconda variabile ridotta: 1 Y1   ln Y2  g Y2  k Y2  e  kY1 g 1 Y1  FY1  y1   FY2  g 1  y1    e 1  ky1 e k e  e y1 La distribuzione EV3 Z3  u   z k   k Y2  u   k   k e  kY1 u z1  u   y Z3  u  u  k  kY1 1  e   y 0 2 2 6 4 10 50 100 T F Poiché k>0 la curva Z3=f(Y1) ha una concavità rivolta verso il basso  k  kY1 1  e   La distribuzione GEV 1/ k FZ  z   e z   z u    1 k       k  0  EV 1 EV 2 k  0  EV 2 EV1 u k  0  EV 3 EV 3 y 0 2 2 6 4 10 50 100 T F