IDROLOGIA Analisi esplorativa di serie di dati ANALISI ESPLORATIVA DI SERIE DI OSSERVAZIONI P Claps IDROLOGIA Analisi esplorativa di serie di dati Rappresentazione tabellare della serie storica Sequenza cronologica Sequenza ordinata Osservazioni di massimo annuo di pioggia in un giorno P Claps 2 IDROLOGIA Analisi esplorativa di serie di dati Rappresentazione grafica della serie storica (Sequenza cronologica) 1986 1981 1976 1971 1966 1961 1956 1951 1946 1941 1936 1931 1926 500 400 300 200 100 0 1921 h(mm) massimo annuo di pioggia in un giorno anno P Claps 3 IDROLOGIA Analisi esplorativa di serie di dati Altro esempio: regione Lombardia. Consumi energetici annui Non stazionarietà (Civile, industria) Bassa variabilità (Agricolt.) P Claps 4 IDROLOGIA Analisi esplorativa di serie di dati Distribuzione del campione (Caratteristiche di variabilità) Ampiezza del campione Diagramma a punti P Claps 5 IDROLOGIA Analisi esplorativa di serie di dati Distribuzione del campione (Caratteristiche di variabilità) • Rappresentazione ad istogramma delle frequenze di classe, sia • Assolute (n°elementi per classe), che • Relative: (n° elementi per classe divisi per N=numero totale dati) frequenza relativa n= numero totale di dati campionari k= numero di classi Numero di dati campionari che ricadono nella classe(0-75) divisi per il numero totale di dati Per evitare arbitrarietà nella determinazione del numero di classi, si può utilizzare la relazione suggerita da Sturges che lega il numero delle classi, k, alla dimensione del campione, N, secondo la relazione : (logaritmo in base 10) P Claps 6 IDROLOGIA Analisi esplorativa di serie di dati Distribuzione del campione (Caratteristiche di variabilità) Curva di Frequenza cumulata (campionaria) 1.2 frequenza cumulata 1 0.8 0.6 0.4 0.2 0 0 50 100 150 200 250 300 350 400 450 X(m m ) Frequenza cumulata campionaria: P Claps 7 IDROLOGIA Analisi esplorativa di serie di dati MOMENTI CAMPIONARI Media campionaria Varianza singolo dato campionario P Claps Media campionaria Coefficiente di Coefficiente di asimmetria (skewness) appiattimento (kurtosi) 8 IDROLOGIA Analisi esplorativa di serie di dati QUARTILI del Campione 1.2 frequenza cumulata 1 0.8 0,75 0.6 0,50 0.4 0,25 0.2 0 0 50 I II 100 III 150 200 250 300 350 400 450 X(m m ) P Claps 9 IDROLOGIA Analisi esplorativa di serie di dati Rappresentazione Box-Plot della serie Limiti del box: Inferiore: I quartile del campione x(Φ=0.25) Superiore: III quartile del campione x(Φ=0.75) Linea mediana: II quartile del campione x(Φ=0.50) Si definisce range interquartile (IQR) la differenza: IQR = X(Φ=0.75) - X(Φ=0.25) P Claps 10 IDROLOGIA Analisi esplorativa di serie di dati Limiti dei whiskers: Inferiore Valor minimo della serie delle osservazioni (X1) oppure I quartile - 1.5 volte IQR ! X(Φ=0.25) - 1.5 IQR Se negativo può essere posto pari a zero quando le osservazioni sono definite positive Superiore Valor massimo della serie delle osservazioni (Xn) oppure III quartile + 1.5 volte IQR ! X(Φ=0.75) + 1.5 IQR P Claps 11 IDROLOGIA Analisi esplorativa di serie di dati Nella rappresentazione con i whiskers si possono indicare tutte le osservazioni di valore inferiore al whisker minimo e superiore al whisker massimo P Claps 12 IDROLOGIA Analisi esplorativa di serie di dati P Claps 13 IDROLOGIA Analisi esplorativa di serie di dati SIMBOLOGIA P Claps 14 CONCETTI FONDAMENTALI DELLA TEORIA DELLE PROBABILITA’. Esperimento aleatorio. Spazio campionario o popolazione. Esempi: Esperimento Popolazione Tipo Numero di giorni piovosi in un anno {0,1,2,.....365} {0,1,2.........} {x; x ! 0} Finito, numero Numero di giorni non piovosi consecutivi Valori osservati della portata Infinito, numero Infinito, non numero • Evento aleatorio semplice A, B, C : ciascun elemento della popolazione (punto). • Evento aleatorio composto A, B, C : insieme di due o più punti. • Complemento dell’elemento A : A : insieme dei punti che non appartengono ad A. • Evento certo ! : insieme di tutti i punti della popolazione. • Evento nullo ! : insieme vuoto. • Unione di eventi A e B : A ! B : insieme dei punti dei due eventi. • Intersezione di A ! C : insieme dei punti comuni ad A e a B PROPRIETA’ FONDAMENTALI DELLA PROBABILITA’. Probabilità dell’evento A: 1. 0 ! P[A] ! 1 2. P[!] = 1 3. Se B = A1 ! A2 ! A3 .... e se A1 , A2 , A3 ..... sono mutuamente escludentisi: P[B] = P[A1 ] + P[A2 ] + P[A3 ] + .... Esempi: [] P A = 1 ! P[A] P[#] = 1 " P[!] = 0 PROBABILITA’ DELLE UNIONI DI EVENTI. Esempio: In un istituto universitario vi sono 10 docenti (3 donne e 7 uomini) e 30 non docenti (10 donne e 20 uomini). Qual è la probabilità che un membro dell’istituto scelto a caso sia un docente e/o una donna? P[D " F ] = P[D] + P[F ] ! P[D ! F ] [ ] Eventi mutuamente escludentisi: P A ! B = 0 PROBABILITA’ CONDIZIONATA. Esempio: Qual è la probabilità che un membro dell’istituto donna sia docente? P[D F ] = P[D ! F ] P[F ] [ ] [ ] [ ] Eventi statisticamente indipendenti: P A ! B = P A ! P B [ ] Eventi mutuamente escludentisi: P A B = 0 TEOREMA DELLA PROBABILITA’ TOTALE. A evento qualsiasi. #eventi mutuamente escludentisi. B1 B2 , B3 ....Bn " !B1 ! B2 ! ..... ! Bn = $ Altra serie di eventi mutuamente escludentisi. (B1 ! A), (B2 ! A), (B3 ! A), ...., (Bn ! A) (B1 " A) ! (B2 " A) ! (B3 " A) ! .... " (Bn ! A) = A P[A] = P[A B1 ]P[B1 ] + P[A B2 ]P[B2 ] + ...... P[A Bn ]P[Bn ] VARIABILI ALEATORIE E LORO DISTRIBUZIONE. Variabili aleatoria o casuale. Il valore assunto da una variabile aleatoria associata con un esperimento dipende dal risultato dell’esperimento. Ad ogni punto dello spazio campionario si associa un valore della variabile. Esempio: “Testa e Croce”: due monete (argento e oro) lanciate simultaneamente. Variabile aleatoria (v.a.): X numero di teste ottenute. Evento Semplice Descrizione Valore di X Dorata Argentata A Croce Croce x=0 B Testa Croce x =1 C Croce Testa x =1 D Testa Testa x=2 VARIABILI DISCRETE. V.a. che possono assumere solo valori interi un dato intervallo. Funzione massa di probabilità (f.m.p.) associa una probabilità ad ogni valore della variabile. P[X = x] = pX (x) Esempio: p X (0) = P[X = 0] = P[A] = 1 4 p X (2) = P[X = 2] = P[D] = 1 4 p x (1) = P[X = 1] = P[B ! C ] = P[B] + P[C ] = • 0 ! pX ( x) ! 1 • !p • P[a " X " b] = X ( xi ) = 1 !p a " xi "b x ( xi ) 1 2 Funzione di distribuzione cumulata. FX ( x) = P[X " x ] = ! p X ( xi ) xi " x Esempio: FX ( x) = P[X " x ] = ! p X ( xi ) xi " x FX (2) = 1 FX (1) = 3 4 FX (0) = 1 4 FX (!1) = 0 VARIABILI ALEATORIE CONTINUE. Possono assumere qualsiasi valore numerico reale in un dato intervallo. Funzione di densità di probabilità. !x !x $ ' P%x ) ( X ( x+ " 2 2# f X ( x) = lim & !x *0 !x b +" ! f X ( x) ! 0 !f #" X ( x)dx = 1 P[a " X " b] = ! f X ( x)dx a Funzione di distribuzione cumulata: +" F X ( x ) = P[ X $ x ] = !f X (u )du #" ! dF X ( x) = f x ( x) solo per variabili assolutamente continue. dx ! FX (!) = 1; ! FX ( x + " ) ! Fx ( x) per qualsiasi ! > 0 ; FX (!") = 0 FX ( x2 ) " FX ( x1 ) = P[x1 ! X ! x2 ] [ ] Per ogni tipo di variabile definita nell’intervallo a, b : ! 0 ! FX ( x) ! 1; FX (a) = 0 ; FX (b) = 1 MOMENTI MEDIA (VALORE SPERATO) di una variabile aleatoria discreta. E[X ] = ! xi Px ( xi ) = µ xi di una variabile aleatoria continua. +" E [X ] = ! xf x ( x)dx = µ #" di una funzione g (x) di una v.a. continua o discreta: E [g ( x)] = ! g ( xi ) Px ( xi ) xi +" E [g ( x)] = ! g ( x) f x ( x)dx #" r-esimo momento di X : µ r = E [X r ] = & xir Px ( xi ) $ !! +' # µ1 = µ = E [X ] r = % x f x ( x)dx ! !" (' xi µ r = E [X r ] r-esimo momento di centrale di X : µr' = E [( X " µ ) r ] = ( ( xi " µ ) r Px ( xi ) & ## ' ' 2 2 2 ' 2 +) %µ1 = 0; µ 2 = var[X ] = ! = E X " E [X ] = µ 2 " µ µr' = E ( X " µ ) r = ' ( x " µ ) r f x' ( x)dx # #$ ") xi [ ] MISURA DI LOCAZIONE. Moda: ~ x f x (~ x ) = max [ ] ! Mediana: x0.5 = x ! Fx ( x ) = 0.50 Media: µ x = E[x] Media geometrica: M g = !x k i i k log M g = E [log x ] MISURA DI DISPERSIONE. [ ] Varianza: var[x] = E ( x " µ ) 2 = ! 2 Scarto quadratico medio: ! = var[x] Coefficiente di variazione: Cv = " =! µ MISURA DI ASIMMETRIA. µ3' Coefficiente di asimmetria: " 1 = Ca = 3 ! MISURA DI APPIATTIMENTO O CURTOSI. µ4' Curtosi: k = 4 ! µ4' Coefficiente di eccesso o di Curtosi: # 2 = k ! 3 = 4 ! 3 " DISTRIBUZIONE NORMALE DEL CASO O DI GAUSS Funzione densità di probabilità: Funzione di distribuzione cumulata: può essere calcolata numericamente per ogni θ1 e θ2. I parametri θ1 e θ2 sono dati da: IDROLOGIA Analisi esplorativa di serie di dati Il confronto tra un campione e la popolazione si può effettuare attraverso la comparazione delle forme delle curve di distribuzione cumulata (campionaria e teorica). Affinchè la comparazione sia coerente, per la distribuzione campionaria si deve usare una Stima della probabilità cumulata della popolazione, chiamata Plotting position Una possibilità valida se non si ha alcuna indicazione sulla distribuzione teorica da usare è: detta Weibull Plotting position (è distribution free). Corrisponde a porre più generale: =0 nella relazione P Claps 18 IDROLOGIA Analisi esplorativa di serie di dati • Distribution dependent Si hanno ad esempio: - Distribuzioni debolmente asimmetriche (Cunnane) - Distribuzioni debolmente asimmetriche (Gringorten) - Distribuzioni fortemente asimmetriche (Hazen) P Claps 19 IDROLOGIA Analisi esplorativa di serie di dati Analogamente, le stime dei momenti della popolazione richiedono alcune correzioni sulle espressioni dei momenti campionari: per la varianza: per l’asimmetria P Claps 20 IDROLOGIA Analisi esplorativa di serie di dati P Claps 21 DISTRIBUZIONE NORMALE IN FORMA CANONICA Variabile normale standardizzata o ridotta Valori notevoli di u(F) e di F(u) F u(F) u F(u) 0.025 -1.96 -2.0 0.0228 0.50 0.00 -1.0 0.1587 0.975 +1.96 0.0 0.5000 1.0 0.8413 2.0 0.9772 inv.s.norm dist-s-norm Esempio: Quantile di X corrispondente a F(x) = 0.025 DISTRIBUZIONI DERIVATE Funzione Y = g(x) strettamente monotona crescente e derivabile di una v.a. continua X Esempio: oppure oppure Quando si conosce la distribuzione della Y e si ricerca quella della X vale, ovviamente Esempio: variabile normale standard Vale anche: MEDIA DI UNA VARIABILE FUNZIONE DI UN ALTRA Se c è una costante: Similmente In generale Esempio: VARIANZA DI UNA VARIABILE FUNZIONE VARIABILE STANDARDIZZATA Carta probabilistica normale In diagramma cartesiano con ascissa X ed ordinata u la funzione di probabilità cumulata F(X)x sarà rappresentata dalla retta Rappresentazione in carta normale delle osservazioni xi Esempio: Fi=0,975 u(Fi)=1,96 PROPRIETA' DELLA DISTRIBUZIONE NORMALE Probabilità che una variabile casuale normale cada in un intervallo Coefficiente di asimmetria: Coefficiente di Curtosi (misura dell appiattimento di una distribuzione): Somma di variabili normali è indipendenti e Periodo di Ritorno L’occorrenza di un nuovo evento puo’ essere considerato un esperimento tipo Bernoulli che genera solo due eventi incompatibili, tipo successo – insuccesso. p = probabilità di un insuccesso . (1-p) = probabilità di un successo . Esempio: Qi Massima portata nell’anno. Q0 Portata di progetto. p=P(Qi>Q0) Tp è il numero medio di insuccessi in T prove. Assegnata la condizione Tp=1 si ha che T è il numero di prove (anni) da attendere mediamente prima di un insuccesso T= PERIODO DI RITORNO Il Rischio (naturale) RESIDUALE Il periodo di ritorno T non caratterizza completamente il rischio idrologico in campo progettuale e nella pianificazione L PL Orizzonte temporale di riferimento. Probabilità di un superamento in un periodo di L anni consecutivi. RL = FX (L) = 1− (1− p) L Tenuto conto che 1 = T (Periodo di Ritorno) p Rischio RESIDUALE Se RL,T è assegnato: RL,T T= " 1% = 1− $1− ' # T& L 1 1− (1− RL.T ) 1 L Esempi La probabilità che in un orizzonte di 10 anni venga superata una piena con T=50 è circa pari al 20% 10 " 1% R10,50 = 1− $1− ' ≅ 0.2 # 50 & Perchè accada una piena con T=50 non si devono attendere 50 anni! Per L<<T vale L RL,T " 1% L = 1− $1− ' ≅ # T& T Si può considerare L come un moltiplicatore del rischio naturale Inoltre: Se L diventa grande, in via approssimata vale: RL,T ≅ 1− e−L/T Che, per L=T conduce a: RL ≅ 1− e−1 = 0.632 Ovvero: Un sistema idrico progettato per un quantile XT corrispondente al periodo di ritorno T sara’ inadeguato con una probabilità 0.632 almeno una volta durante un periodo di T anni. DISTRIBUZIONE LOG-NORMALE La variabile X si dice log-normalmente distribuita se: è normalmente distribuita Funzione di densità di probabilità: Espressioni teoriche dei momenti: Relazioni tra momenti e parametri: Due parametri: e Due momenti della popolazione: e Espressioni semplificate: per per piccolo Carta probabilistica Log-normale In diagramma cartesiano con ascissa ln X ed ordinata u la funzione di probabilità cumulata F(Y)y sarà rappresentata dalla retta Rappresentazione in carta Log-normale delle osservazioni xi L’asse delle ascisse puo’ essere Relativo alle y o, in scala logaritmica, Anche riferito alle x. Esempio: Fi=0,975 u(Fi)=1,96