Distribuzioni limite

La distribuzione normale
Si consideri una variabile casuale rappresentata mediante una combinazione
lineare di altre variabili casuali e che di tale variabile casuale si voglia
determinare la distribuzione di probabilità
Teorema del limite centrale
“Sotto condizioni molto generali, man mano che il numero delle variabili presenti
nella sommatoria diventa grande, la distribuzione della variabile somma si
avvicina sempre più alla distribuzione normale”.
Oss.: Il teorema vale in “condizioni molto generali” ovvero se (1) le variabili
considerate nella sommatoria sono indipendenti e ugualmente distribuite, (2) se le
variabili sono indipendenti e diversamente distribuite.
Il termine “si avvicina” non va inteso nel senso matematico di limite ma è più
opportuno leggerlo come “viene approssimata da”. Infine, il termine “grande”
dipende dalla bontà dell’approssimazione richiesta e dalla natura delle distribuzioni
delle variabili presenti nella somma.
Distribuzioni limite

La distribuzione normale
2
 

x

m
1
1
X 
fX ( x )
exp - 
 2 σ
 
σ X 2π
  X  
FX ( x )  P X  x 
x

f X ( x )dx
  x  
Distribuzioni limite

La distribuzione normale
Variabile standardizzata
u
x  mX
σX

 xm 
x  mX 
X
  FU 
FX ( x )  P X  x  P U 
 FU u
 σ

σ X 

 X 
Modello limite dell’operatore valore estremo
Sia Z la variabile massimo di n variabili casuali Xi
Z  max  X1 ,..... X n 
La sua funzione di probabilità cumulata è:
FZ ( z )  PZ  z  P tutte le X i  z i 1,2,...,n
Se tutte le Xi sono indipendenti:
FZ ( z )  P  X1  z  P  X 2  z  ... P  X n  z 
 FX ( z ) FX ( z ) .... FX ( z )
1
2
n
Modello limite dell’operatore valore estremo
Nel caso in cui tutte le Xi abbiano la medesima distribuzione di probabilità, si ha:
FZ ( z )  FX ( z )
n
n 1
d
f Z ( z )  FZ ( z )  n FX ( z ) f X ( z )
dz
La distribuzione di Gumbel
Da prima:
Se le variabili Xi sono
a) indipendenti fra di loro
b) ugualmente distribuite
e se
(c) n tende all’infinito
(d) la coda della distribuzione di probabilità cumulata della generica Xi
può essere approssimata dalla seguente legge:
FX  x   1  e
 g  x
con g(x) monotona crescente, allora:

 z  u 
FZ  z   exp   exp  

  

  z  
 0
La distribuzione di Gumbel
 mZ  u  0,5772

 2  2 2
 Z 
6

La media e la varianza della popolazione si stimano con la media e la varianza
campionaria
mˆ Z  z 
1
N
ˆ Z2  sZ2 
1
2
z

z


 i
N 1
z
i
Sostituendo le stime della media e della varianza della popolazione nel sistema è
possibile stimare i coefficienti u e .
La variabile ridotte di Gumbel
Sia:
Y 
Z u

 g Z 
Ne segue che la distribuzione di probabilità cumulata di Y è:
FY  y   FZ  g 1  y  
dove
g 1  y    y  u
Pertanto:

 g 1  y   u  
FY  y   exp   exp  
   exp   exp   y  



 
La variabile ridotte di Gumbel
Da questo segue:

Y   ln  ln  FY  y  
Ma essendo

FY  y   1 

 1 
Y   ln   ln 1   
 T 

1
T
Il piano di Gumbel
Quindi:
z  u  y

 1 
Y   ln   ln 1   
 T 

z
z  u  y
u
y
0
2
2
6
4
10
50
100
T
F
Pertanto nel piano di Gumbel la variabile Z è legata alla variabile ridotta Y da una
legge lineare che mostra u come intercetta (parametro di posizione) e  come
parametro che ne descrive la pendenza (parametro di scala).
Il piano di Gumbel
20000
z  u  y
18000
16000
Q (m3/s)
14000
12000
10000
8000
6000
4000
Qmax
2000
0
EV1
2
5
10
20
T (years)
50 100 200
500 1000
Plotting position
Per riportare i punti campionari nel piano di Gumbel si procede nel seguente modo:
Si ordina il campione in modo crescente
Si stima la frequenza campionaria con una formula del tipo:
ia
ˆ
Fi 
N b
dove N è il numero dei dati che compongono il campione
a e b variano a seconda della formula:
nel caso di Gringorten a= 0,44 e b=0,12
i è la posizione del i-esimo valore nel campione ordinato
Si associa la frequenza campionaria stimata alla variabile ridotta di
Gumbel nel seguente modo:
  
yi   ln  ln Fˆi
Plotting position
  
yi   ln  ln Fˆi
Si formano le coppie xi,yi dove xi è il valore numerico del dato campionario che
occupata la i-esima posizione nel campione ordinato in modo crescente
20000
18000
16000
Q (m3/s)
14000
12000
10000
8000
6000
4000
Qmax
2000
0
EV1
2
5
10
20
T (years)
50 100 200
500 1000
La distribuzione EV2
Z2  max  X1 ,..... X n 
Le variabili Xi sono
a) indipendenti fra di loro
b) ugualmente distribuite
e se
(c) n tende all’infinito
(d) la coda della distribuzione di probabilità cumulata della generica Xi
può essere approssimata dalla seguente legge:
1
k
 x
FX  x   1    ; k  0, x  x0
 x0 
allora:
1


k
z2  u   



FZ2  z2   exp  1  k

 
  


k  0,   0

u   z2  
k
La distribuzione EV2
Riportiamo la distribuzione EV2 sul piano di Gumbel
Introduco una prima variabile ridotta:
Y2
Z2  u 

 1 k
g
Z2  u 

k



k
 Z2 
Y2  g 1 Y2 
1


k
z

u




2


Da prima: FZ2  z2   exp  1  k

 
  


quindi:
1


1
k
FY2  y2   FZ2  g  y2    exp  y2 


La distribuzione EV2
Y2
Però non è ancora la variabile ridotta di Gumbel
Introduco una seconda variabile ridotta:
1
Y1   ln Y2  g Y2 
k
Y2  e
 kY1
g
1
Y1 
FY1  y1   FY2  g
1
 y1    e
1
 ky1
e k
e
 e y1
La distribuzione EV2
z2  u 
z

k


k
y2  u 

k


k
 1  e ky1 
z2  u   

 k 
z1  u   y
u
y
0
2
2
6
4
10
50
100
T
F
Poiché k<0 la curva Z2=f(Y1) ha una concavità rivolta verso l’alto e andamento
esponenziale
e  ky1
La distribuzione EV2
E Y2   my2  (1  k )
Var Y2   E Y2 2   E 2 Y2   (1  2k )   2 (1  k )
y 
2
3

E Y2  E Y2  


 E Y  E Y   
2
2

2
3/ 2
E Y23   3E Y2 2  E Y2   2 E 3 Y2 


3/ 2
2

E Y2  E Y2  



(1  3k )  3(1  2k )(1  k )  2 3 (1  k )
 (1  2k )   (1  k ) 
2
3/ 2

La distribuzione EV2
Essendo
z2  u 

k


k
y2
Si ha:
E  Z 2   mz 2  u 
Var  Z 2  
z y
2
2
2
k
2

k

Var Y2 

k
m y2
La distribuzione EV2
Operativamente
1
z2   z2,i
n
E  Z 2   mz 2  u 
2
1
s
z2,i  z2 


n 1
z
2
n2 M 3
g
 n  1 n  2  s 3
Var  Z 2  
y 
2
1
M 3    z2,i  z2 
n
2
k
2

k


k
m y2
Var Y2 

(1  3k )  3(1  2k )(1  k )  23 (1  k )
 (1  2k )  2 (1  k ) 
u
3/ 2
k
La distribuzione EV3
Z3  max  X1 ,..... X n 
Le variabili Xi sono
a) indipendenti fra di loro
b) ugualmente distribuite
e se
(c) n tende all’infinito
(d) la coda della distribuzione di probabilità cumulata della generica Xi
può essere approssimata dalla seguente legge:
1
k
FX  x   1  c  x  x0  ; k  0, x  x0
allora:
1


k
z

u



 
FZ3  z3   exp   1  k 3

 
  


k  0,   0
  z3  u 

k
La distribuzione EV3
Riportiamo la distribuzione EV3 sul piano di Gumbel
Introduco una prima variabile ridotta:
Y2
Z3  u 

 1 k
g

Z3  u 
Da prima:

k


k
 Z3 
Y2  g 1 Y2 
1


k
z

u





FZ3  z3   exp   1  k 3

 
  


quindi:
1


1
k
FY2  y2   FZ3  g  y2    exp  y2 


La distribuzione EV2
Introduco una seconda variabile ridotta:
1
Y1   ln Y2  g Y2 
k
Y2  e
 kY1
g
1
Y1 
FY1  y1   FY2  g
1
 y1    e
1
 ky1
e k
e
 e y1
La distribuzione EV2
Z3  u 

z
k


k
Y2  u 

k


k
e
 kY1
u
z1  u   y
Z3  u 
u

k
 kY1
1

e


y
0
2
2
6
4
10
50
100
T
F
Poiché k>0 la curva Z3=f(Y1) ha una concavità rivolta verso il basso

k
 kY1
1

e


La distribuzione GEV
1/ k
FZ  z   e
z

 z u  
 1 k 

  

k  0  EV 1
EV 2
k  0  EV 2
EV1
u
k  0  EV 3
EV 3
y
0
2
2
6
4
10
50
100
T
F