IDROLOGIA
Analisi esplorativa di serie di dati
ANALISI ESPLORATIVA
DI SERIE DI OSSERVAZIONI
P Claps
IDROLOGIA
Analisi esplorativa di serie di dati
Rappresentazione tabellare della serie storica
Sequenza
cronologica
Sequenza
ordinata
Osservazioni di massimo annuo
di pioggia in un giorno
P Claps
2
IDROLOGIA
Analisi esplorativa di serie di dati
Rappresentazione grafica della serie storica (Sequenza cronologica)
1986
1981
1976
1971
1966
1961
1956
1951
1946
1941
1936
1931
1926
500
400
300
200
100
0
1921
h(mm)
massimo annuo di pioggia in un giorno
anno
P Claps
3
IDROLOGIA
Analisi esplorativa di serie di dati
Altro esempio: regione Lombardia. Consumi energetici annui
Non stazionarietà (Civile,
industria)
Bassa variabilità (Agricolt.)
P Claps
4
IDROLOGIA
Analisi esplorativa di serie di dati
Distribuzione del campione (Caratteristiche di variabilità)
Ampiezza del campione
Diagramma a punti
P Claps
5
IDROLOGIA
Analisi esplorativa di serie di dati
Distribuzione del campione (Caratteristiche di variabilità)
•  Rappresentazione ad istogramma delle frequenze di classe, sia
•  Assolute (n°elementi per classe), che
•  Relative: (n° elementi per classe divisi per N=numero totale dati)
frequenza relativa
n= numero totale di dati campionari
k= numero di classi
Numero di dati campionari che ricadono nella classe(0-75)
divisi per il numero totale di dati
Per evitare arbitrarietà nella determinazione del numero di classi, si può utilizzare la relazione suggerita da Sturges che lega il
numero delle classi, k, alla dimensione del campione, N, secondo la relazione :
(logaritmo in base 10)
P Claps
6
IDROLOGIA
Analisi esplorativa di serie di dati
Distribuzione del campione (Caratteristiche di variabilità)
Curva di Frequenza cumulata (campionaria)
1.2
frequenza cumulata
1
0.8
0.6
0.4
0.2
0
0
50
100
150
200
250
300
350
400
450
X(m m )
Frequenza cumulata campionaria:
P Claps
7
IDROLOGIA
Analisi esplorativa di serie di dati
MOMENTI CAMPIONARI
Media campionaria
Varianza
singolo dato campionario
P Claps
Media campionaria
Coefficiente di
Coefficiente di
asimmetria (skewness)
appiattimento (kurtosi)
8
IDROLOGIA
Analisi esplorativa di serie di dati
QUARTILI del Campione
1.2
frequenza cumulata
1
0.8
0,75
0.6
0,50
0.4
0,25
0.2
0
0
50
I
II
100
III
150
200
250
300
350
400
450
X(m m )
P Claps
9
IDROLOGIA
Analisi esplorativa di serie di dati
Rappresentazione Box-Plot della serie
Limiti del box:
Inferiore:
I quartile del campione
x(Φ=0.25)
Superiore:
III quartile del campione
x(Φ=0.75)
Linea mediana:
II quartile del campione
x(Φ=0.50)
Si definisce range interquartile (IQR) la differenza:
IQR = X(Φ=0.75) - X(Φ=0.25)
P Claps
10
IDROLOGIA
Analisi esplorativa di serie di dati
Limiti dei whiskers:
Inferiore
Valor minimo della serie delle osservazioni (X1)
oppure
I quartile - 1.5 volte IQR ! X(Φ=0.25) - 1.5 IQR
Se negativo può essere posto pari a zero quando le osservazioni sono
definite positive
Superiore
Valor massimo della serie delle osservazioni (Xn)
oppure
III quartile + 1.5 volte IQR ! X(Φ=0.75) + 1.5 IQR
P Claps
11
IDROLOGIA
Analisi esplorativa di serie di dati
Nella rappresentazione con i whiskers si possono indicare tutte le
osservazioni di valore inferiore al whisker minimo e superiore al
whisker massimo
P Claps
12
IDROLOGIA
Analisi esplorativa di serie di dati
P Claps
13
IDROLOGIA
Analisi esplorativa di serie di dati
SIMBOLOGIA
P Claps
14
CONCETTI FONDAMENTALI DELLA TEORIA DELLE PROBABILITA’.
Esperimento aleatorio.
Spazio campionario o popolazione.
Esempi:
Esperimento
Popolazione
Tipo
Numero di giorni piovosi in un anno
{0,1,2,.....365}
{0,1,2.........}
{x; x ! 0}
Finito, numero
Numero di giorni non piovosi consecutivi
Valori osservati della portata
Infinito, numero
Infinito, non numero
•
Evento aleatorio semplice A, B, C : ciascun elemento della popolazione (punto).
•
Evento aleatorio composto A, B, C : insieme di due o più punti.
•
Complemento dell’elemento A : A : insieme dei punti che non appartengono ad A.
•
Evento certo ! : insieme di tutti i punti della popolazione.
•
Evento nullo ! : insieme vuoto.
•
Unione di eventi A e B : A ! B : insieme dei punti dei due eventi.
•
Intersezione di A ! C : insieme dei punti comuni ad A e a B
PROPRIETA’ FONDAMENTALI DELLA PROBABILITA’.
Probabilità dell’evento A:
1.
0 ! P[A] ! 1
2.
P[!] = 1
3. Se B = A1 ! A2 ! A3 .... e se A1 , A2 , A3 ..... sono mutuamente escludentisi:
P[B] = P[A1 ] + P[A2 ] + P[A3 ] + ....
Esempi:
[]
P A = 1 ! P[A]
P[#] = 1 " P[!] = 0
PROBABILITA’ DELLE UNIONI DI EVENTI.
Esempio: In un istituto universitario vi sono 10 docenti (3 donne e 7 uomini) e 30 non docenti (10
donne e 20 uomini).
Qual è la probabilità che un membro dell’istituto scelto a caso sia un docente e/o una donna?
P[D " F ] = P[D] + P[F ] ! P[D ! F ]
[
]
Eventi mutuamente escludentisi: P A ! B = 0
PROBABILITA’ CONDIZIONATA.
Esempio: Qual è la probabilità che un membro dell’istituto donna sia docente?
P[D F ] =
P[D ! F ]
P[F ]
[
]
[ ] [ ]
Eventi statisticamente indipendenti: P A ! B = P A ! P B
[ ]
Eventi mutuamente escludentisi: P A B = 0
TEOREMA DELLA PROBABILITA’ TOTALE.
A evento qualsiasi.
#eventi mutuamente escludentisi.
B1 B2 , B3 ....Bn "
!B1 ! B2 ! ..... ! Bn = $
Altra serie di eventi mutuamente escludentisi.
(B1 ! A), (B2 ! A), (B3 ! A), ...., (Bn ! A)
(B1 " A) ! (B2 " A) ! (B3 " A) ! .... " (Bn ! A) = A
P[A] = P[A B1 ]P[B1 ] + P[A B2 ]P[B2 ] + ...... P[A Bn ]P[Bn ]
VARIABILI ALEATORIE E LORO DISTRIBUZIONE.
Variabili aleatoria o casuale.
Il valore assunto da una variabile aleatoria associata con un esperimento dipende dal risultato
dell’esperimento.
Ad ogni punto dello spazio campionario si associa un valore della variabile.
Esempio:
“Testa e Croce”: due monete (argento e oro) lanciate simultaneamente.
Variabile aleatoria (v.a.): X numero di teste ottenute.
Evento Semplice
Descrizione
Valore di X
Dorata
Argentata
A
Croce
Croce
x=0
B
Testa
Croce
x =1
C
Croce
Testa
x =1
D
Testa
Testa
x=2
VARIABILI DISCRETE.
V.a. che possono assumere solo valori interi un dato intervallo.
Funzione massa di probabilità (f.m.p.) associa una probabilità ad ogni valore della variabile.
P[X = x] = pX (x)
Esempio:
p X (0) = P[X = 0] = P[A] =
1
4
p X (2) = P[X = 2] = P[D] =
1
4
p x (1) = P[X = 1] = P[B ! C ] = P[B] + P[C ] =
•
0 ! pX ( x) ! 1
•
!p
•
P[a " X " b] =
X
( xi ) = 1
!p
a " xi "b
x
( xi )
1
2
Funzione di distribuzione cumulata.
FX ( x) = P[X " x ] = ! p X ( xi )
xi " x
Esempio:
FX ( x) = P[X " x ] = ! p X ( xi )
xi " x
FX (2) = 1 FX (1) =
3
4
FX (0) =
1
4
FX (!1) = 0
VARIABILI ALEATORIE CONTINUE.
Possono assumere qualsiasi valore numerico reale in un dato intervallo.
Funzione di densità di probabilità.
!x
!x $
'
P%x )
( X ( x+ "
2
2#
f X ( x) = lim &
!x *0
!x
b
+"
!
f X ( x) ! 0
!f
#"
X
( x)dx = 1
P[a " X " b] = ! f X ( x)dx
a
Funzione di distribuzione cumulata:
+"
F X ( x ) = P[ X $ x ] =
!f
X
(u )du
#"
!
dF X ( x)
= f x ( x) solo per variabili assolutamente continue.
dx
!
FX (!) = 1;
!
FX ( x + " ) ! Fx ( x) per qualsiasi ! > 0 ;
FX (!") = 0
FX ( x2 ) " FX ( x1 ) = P[x1 ! X ! x2 ]
[ ]
Per ogni tipo di variabile definita nell’intervallo a, b :
!
0 ! FX ( x) ! 1;
FX (a) = 0 ;
FX (b) = 1
MOMENTI
MEDIA (VALORE SPERATO) di una variabile aleatoria discreta.
E[X ] = ! xi Px ( xi ) = µ
xi
di una variabile aleatoria continua.
+"
E [X ] =
! xf
x
( x)dx = µ
#"
di una funzione g (x) di una v.a. continua o discreta:
E [g ( x)] = ! g ( xi ) Px ( xi )
xi
+"
E [g ( x)] =
! g ( x) f
x
( x)dx
#"
r-esimo momento di X :
µ r = E [X r ] = & xir Px ( xi ) $
!!
+'
# µ1 = µ = E [X ]
r
= % x f x ( x)dx !
!"
('
xi
µ r = E [X r ]
r-esimo momento di centrale di X :
µr' = E [( X " µ ) r ] = ( ( xi " µ ) r Px ( xi ) &
##
'
'
2
2
2
'
2
+)
%µ1 = 0; µ 2 = var[X ] = ! = E X " E [X ] = µ 2 " µ
µr' = E ( X " µ ) r = ' ( x " µ ) r f x' ( x)dx #
#$
")
xi
[
]
MISURA DI LOCAZIONE.
Moda: ~
x
f x (~
x ) = max
[ ]
!
Mediana: x0.5 = x
!
Fx ( x ) = 0.50
Media:
µ x = E[x]
Media geometrica: M g =
!x k
i i
k
log M g = E [log x ]
MISURA DI DISPERSIONE.
[
]
Varianza: var[x] = E ( x " µ ) 2 = ! 2
Scarto quadratico medio:
! = var[x]
Coefficiente di variazione: Cv =
"
=!
µ
MISURA DI ASIMMETRIA.
µ3'
Coefficiente di asimmetria: " 1 = Ca = 3
!
MISURA DI APPIATTIMENTO O CURTOSI.
µ4'
Curtosi: k = 4
!
µ4'
Coefficiente di eccesso o di Curtosi: # 2 = k ! 3 = 4 ! 3
"
DISTRIBUZIONE NORMALE DEL CASO O DI GAUSS
Funzione densità di probabilità:
Funzione di distribuzione cumulata:
può essere calcolata numericamente per ogni θ1 e θ2.
I parametri θ1 e θ2 sono dati da:
IDROLOGIA
Analisi esplorativa di serie di dati
Il confronto tra un campione e la popolazione si può effettuare attraverso la
comparazione delle forme delle curve di distribuzione cumulata (campionaria e
teorica).
Affinchè la comparazione sia coerente, per la distribuzione campionaria si deve usare
una Stima della probabilità cumulata della popolazione, chiamata Plotting position
Una possibilità valida se non si ha alcuna indicazione sulla distribuzione teorica da
usare è:
detta Weibull Plotting position (è distribution free).
Corrisponde a porre
più generale:
=0 nella relazione
P Claps
18
IDROLOGIA
Analisi esplorativa di serie di dati
•  Distribution dependent
Si hanno ad esempio:
- Distribuzioni debolmente asimmetriche (Cunnane)
- Distribuzioni debolmente asimmetriche (Gringorten)
- Distribuzioni fortemente asimmetriche (Hazen)
P Claps
19
IDROLOGIA
Analisi esplorativa di serie di dati
Analogamente, le stime dei momenti della popolazione richiedono
alcune correzioni sulle espressioni dei momenti campionari:
per la varianza:
per l’asimmetria
P Claps
20
IDROLOGIA
Analisi esplorativa di serie di dati
P Claps
21
DISTRIBUZIONE NORMALE IN FORMA CANONICA
Variabile normale standardizzata o ridotta
Valori notevoli di u(F) e di F(u)
F
u(F)
u
F(u)
0.025
-1.96
-2.0
0.0228
0.50
0.00
-1.0
0.1587
0.975
+1.96
0.0
0.5000
1.0
0.8413
2.0
0.9772
inv.s.norm
dist-s-norm
Esempio:
Quantile di X corrispondente a F(x) = 0.025
DISTRIBUZIONI DERIVATE
Funzione Y = g(x) strettamente monotona crescente e derivabile di una v.a. continua X
Esempio:
oppure
oppure
Quando si conosce la distribuzione della Y e si ricerca quella della X vale, ovviamente
Esempio: variabile normale standard
Vale anche:
MEDIA DI UNA VARIABILE FUNZIONE DI UN ALTRA
Se c è una costante:
Similmente
In generale
Esempio:
VARIANZA DI UNA VARIABILE FUNZIONE
VARIABILE STANDARDIZZATA
Carta probabilistica normale
In diagramma cartesiano con ascissa X ed ordinata u la funzione di probabilità
cumulata F(X)x sarà rappresentata dalla retta
Rappresentazione in carta normale delle osservazioni xi
Esempio:
Fi=0,975
u(Fi)=1,96
PROPRIETA' DELLA DISTRIBUZIONE NORMALE
Probabilità che una variabile casuale normale cada in un intervallo
Coefficiente di asimmetria:
Coefficiente di Curtosi (misura dell appiattimento di una distribuzione):
Somma di variabili normali
è
indipendenti e
Periodo di Ritorno
L’occorrenza di un nuovo evento puo’ essere considerato un esperimento tipo
Bernoulli che genera solo due eventi incompatibili, tipo successo – insuccesso.
p = probabilità di un insuccesso .
(1-p) = probabilità di un successo .
Esempio:
Qi Massima portata nell’anno.
Q0 Portata di progetto.
p=P(Qi>Q0)
Tp è il numero medio di insuccessi in T prove.
Assegnata la condizione Tp=1 si ha che
T è il numero di prove (anni) da attendere mediamente prima
di un insuccesso
T=
PERIODO DI RITORNO
Il Rischio (naturale) RESIDUALE
Il periodo di ritorno T non caratterizza completamente il
rischio idrologico in campo progettuale e nella pianificazione
L
PL
Orizzonte temporale di riferimento.
Probabilità di un superamento in un periodo di L anni consecutivi.
RL = FX (L) = 1− (1− p)
L
Tenuto conto che
1
= T (Periodo di Ritorno)
p
Rischio RESIDUALE
Se
RL,T è assegnato:
RL,T
T=
" 1%
= 1− $1− '
# T&
L
1
1− (1− RL.T )
1
L
Esempi
La probabilità che in un orizzonte di 10 anni venga superata una
piena con T=50 è circa pari al 20%
10
"
1%
R10,50 = 1− $1− ' ≅ 0.2
# 50 &
Perchè accada una piena con T=50 non si devono attendere 50
anni!
Per L<<T vale
L
RL,T
" 1%
L
= 1− $1− ' ≅
# T& T
Si può considerare L come un moltiplicatore del rischio naturale
Inoltre:
Se L diventa grande, in via approssimata vale:
RL,T ≅ 1− e−L/T
Che, per L=T conduce a:
RL ≅ 1− e−1 = 0.632
Ovvero:
Un sistema idrico progettato per un quantile XT corrispondente al
periodo di ritorno T sara’ inadeguato con una probabilità 0.632 almeno
una volta durante un periodo di T anni.
DISTRIBUZIONE LOG-NORMALE
La variabile X si dice log-normalmente distribuita se:
è normalmente distribuita
Funzione di densità di probabilità:
Espressioni teoriche dei momenti:
Relazioni tra momenti e parametri:
Due parametri:
e
Due momenti della popolazione:
e
Espressioni semplificate:
per
per
piccolo
Carta probabilistica Log-normale
In diagramma cartesiano con ascissa ln X ed ordinata u la funzione di
probabilità cumulata F(Y)y sarà rappresentata dalla retta
Rappresentazione in carta Log-normale delle osservazioni xi
L’asse delle ascisse puo’ essere
Relativo alle y o, in scala logaritmica,
Anche riferito alle x.
Esempio:
Fi=0,975
u(Fi)=1,96