Variabili aleatorie – Parte I • Variabili aleatorie Scalari - Definizione • Funzioni di distribuzione di una VA • Funzioni densità di probabilità di una VA • Indici di posizione di una distribuzione • Indici di dispersione di una distribuzione • Definizione Momenti di una distribuzione Teoria della Probabilità Variabile aleatoria - Definizione • Una variabile aleatoria è una funzione che associa ad ogni esito di un processo aleatorio (nell’esempio, una certa faccia del dado) un distinto numero reale (nel nostro caso un numero intero compreso tra 1 e 6). • Associare ad un processo aleatorio (scalare) un numero reale è un procedimento che facciamo spesso in modo intuitivo Statistica - M.Grosso Variabili Aleatorie - Parte 1 1 Variabili aleatorie – Definizione • Una variabile aleatoria è una funzione che associa ad ogni esito di un processo aleatorio, un distinto numero reale Ω Variabile aleatoria Y Insieme dei possibili risultati nello spazio campione Ω • In termini rigorosi Y : ω œ Ω Ø y=Y(ω) œ Ψ Ψ Insieme valori numerici che assume la funzione Y Si definisce pertanto una nuova funzione probabilità il cui spazio campione è il codominio Ψ della funzione Y Variabili aleatorie - Definizione • La variabile aleatoria Y è una funzione che assume valori tali che dipendono dal “caso” • Proprietà: – Y è definita nello spazio Ω degli esperimenti ed assume valori nello spazio campione Ψ (codominio) sottoinsieme dei numeri reali. – Qualunque sottoinsieme del codominio Ψ (evento) ha una probabilità ben definita di accadere – Tale concetto di probabilità deve essere coerente con gli assiomi di Kolmogoroff • Nel seguito, si indicherà con • Y la variabile aleatoria • y l’esito della singola esperienza della variabile aleatoria Statistica - M.Grosso Variabili Aleatorie - Parte 1 2 Variabili aleatorie – Definizione • Da notare che Y è una funzione (variabile aleatoria) mentre i valori assunti da tale funzione y=Y(ω), valori calcolabili quando l’esito dell’esperimento sia noto, sono numeri reali • Nel seguito: Y y → → variabile aleatoria singolo esito osservato della VA Variabili aleatorie - Definizione • L’opportunità di associare ad ogni esito di un processo stocastico un numero reale semplifica la rappresentazione degli eventi aleatori e la loro manipolazione matematica. matematica • È possibile, per esempio, introdurre una relazione d’ordine nel codominio dello spazio degli eventi. • In particolare data una variabile aleatoria Y(ω) è possibile, per ogni y0, definire un evento (in genere non elementare) così fatto: Ay = {ω Y (ω ) ≤ y0 }∈ S 0 • Questo implica che è possibile definire la probabilità per ogni insieme del tipo: I ( y0 ) = {y ≤ y0 } Statistica - M.Grosso Variabili Aleatorie - Parte 1 3 Funzioni di distribuzione di una VA scalare • Si può facilmente dimostrare che per ogni variabile aleatoria Y la funzione (reale di una variabile reale) distribuzione di probabilità (CDF: Cumulative Distribution Function) FY(y0)= P{Y ≤ y0} è sufficiente per definire la probabilità di un qualunque evento pertinente alla variabile aleatorio. Funzioni distribuzione di una VA scalare • Proprietà della distribuzione di probabilità 1. FY(+ ∞) = 1, FY(-∞) = 0 2. FY è una funzione non decrescente 3. Se FY(y0)=0 allora FY(y)=0 se y <y0 4. P {Y >y1 } = 1- FY(y1) 5 FY è una funzione 5. f i continua i da d destra: d FY(y ( +) = FY(y) ( ) 6. P {y1 < Y ≤ y2} = FY(y2)-FY(y1) • Da notare che molte proprietà sono una diretta conseguenza degli assiomi di Kolmogoroff e derivati Statistica - M.Grosso Variabili Aleatorie - Parte 1 4 Funzioni distribuzione di una VA scalare • Esempio - Proprietà 1: • FY(+¶) ( ) = P{Y(ω)≤+¶} P{Y( ) } = P{Y œ Ψ} = P{ωœ P{ Ω} 1 Ω}=1 • Analogamente: • FY(- ∞) = P{Y ≤ -∞} = P(Y œ Ø)= 0 •Esempio - Proprietà 6: P {y1 < Y ≤ y2} = FY(y2)-FY(y1) {Y ≤ y1 } e {y { 1 <Y Y ≤ y2} sono disgiunti. di i ti D’altra D’ lt parte, t {Y ≤ y2}= {Y ≤ y1 } ∪ { y1 <Y ≤ y2} da cui si deduce la proprietà. Nota la FY(y) siamo in grado di ricavare la probabilità di qualunque evento Funzioni distribuzione di una VA scalare • Esempio di calcolo di probabilità di un evento dalla funzione di distribuzione. Calcolo probabilità evento A A = A1 » A2 FY(d) FY(c) FY(b) A1 … A2 = Ø FY(a) P{y œ A} =P{y œ A1}+P{y œ A2} =FY(b)-FY(a)+ FY(d)-FY(c) Statistica - M.Grosso Variabili Aleatorie - Parte 1 a b c d y A1 A2 5 Funzioni distribuzione di una VA scalare (Caso Discreto) • Esempio: Lancio dei dadi F è una funzione a gradini dini nel n l caso s discreto 1,0 F(x) 0,8 0,6 È comunque una funzione continua a destra 0,4 0,2 0,0 0 1 2 3 4 5 6 7 x F crescente 0 ≤ F (y) ≤ 1 • Proprietà: F(y) = 0 per ogni y minore del più piccolo valore nello spazio di X Funzioni di densità di probabilità di una VA scalare • In molte circostanze, per la caratterizzazione delle variabili aleatorie è molto più utile ricorrere alla derivata della funzione di distribuzione fY ( y ) = • • y d FY ( y ) ovvero FY ( y ) = ∫ f ( u ) du dy −∞ La funzione fY(y) prende il nome di funzione densità di probabilità (pdf) Proprietà della funzione densità di probabilità 1. fY(y) ≥ 0 sempre +∞ 2. ∫ f (ξ ) dξ = 1 −∞ 3. F ( y2 ) − F ( y1 ) = y2 ∫ f (ξ ) d ξ y1 Statistica - M.Grosso Variabili Aleatorie - Parte 1 6 Funzioni densità di probabilità di una VA scalare • Esempio di calcolo di probabilità di un evento dalla funzione densità di probabilità fY(y) P ( y ∈ A) = P( y ∈ A1 ) + P( y ∈ A2 ) = ∫ fY ( y )dy + ∫ fY ( y )dy = A1 A2 ∫ fY ( y )dy + ∫ fY ( y )dy b d a c a b c d y A1 A2 Funzioni densità di probabilità di una VA scalare • Nei casi di maggiore interesse la variabile aleatoria Y è di tipo continuo, ovvero può assumere un qualunque valore lungo l’intervallo in cui è definito • In tal caso la funzione di distribuzione è una funzione di tipo continua e la probabilità che si verifichi un evento elementare è pari a zero: ω −δ (F (ω ) − F (ω − δ )) = ∫ fY ( y )dy = 0 P(Y = ω ) = lim δ →0 ω Statistica - M.Grosso Variabili Aleatorie - Parte 1 7 Funzioni densità di probabilità di una VA scalare • Nel caso di Variabile Aleatoria discreta, la definizione cambia: ⎧ P(Y = yi ) per y = yi ⎫ fY ( y ) = ⎨ ⎬ = P(Y = y ) 0 per y ≠ yi ⎭ ⎩ P2 fY P1 Ovviamente: P3 y1 y2 y3 … … Pn n ∑ Pi = 1 i =1 yn Variabili aleatorie: Indici di posizione e dispersione • Media (o valore atteso) • Il valore medio di una variabile aleatoria è dato da: μY = ∑ y j f Y ( y j ) Y discreta j +∞ μY = ∫ y fY ( y )dy Y continua −∞ • Tale valore p prende anche il nome di VALORE ATTESO della variabile aleatoria Y ed è indicato con il simbolo μY=E(Y) Statistica - M.Grosso Variabili Aleatorie - Parte 1 8 Variabili aleatorie: Indici di posizione e dispersione • La media esiste solo se esiste finito la seguente quantità: ∑ y j fY ( y j ) Y discreta j +∞ ∫ y fY ( y ) dy Y continua −∞ • Se una distribuzione è simmetrica rispetto a y=c, (f(c+y)=f(c-y)) sii vede d che h μ=c Variabili aleatorie: Indici di posizione e dispersione FY (m ) = 1 2 0.5 Area = 0.5 05 0.4 0.3 fY(y) • Altre misure del trend centrale: • Mediana di una variabile aleatoria Y • Il valore m per cui: Area = 0.5 0.2 0.1 • Moda di una variabile aleatoria Y • Il valore c per cui la funzione densità di probabilità assume valore massimo: 0.0 0 2 Mediana 4 fY max fY(y) max 0.3 fY(y) • Se la distribuzione è simmetrica, media e mediana coincidono. 8 0.5 0.4 c: 6 y 0.2 0.1 0.0 0 Statistica - M.Grosso Variabili Aleatorie - Parte 1 2 Moda 4 y 6 8 9 Variabili aleatorie: Indici di posizione e dispersione • Nel caso generale di distribuzioni non simmetriche media, mediana e moda non coincidono Moda 0.5 Mediana 0.4 Media fY(y) 0.3 0.2 0.1 0.0 0 2 4 y 6 8 Variabili aleatorie: Indici di posizione e dispersione • Una generalizzazione del concetto di mediana è il percentile ovvero il valore qα tale che: FY (qα ) = α 25mo percentile 0.5 0.4 FY (qα ) = 0.25 0.3 fY(y) • Esempio: il 25mo percentile è il valore q0.25 tale che: 0.2 0.1 0.0 -4 -2 0 2 4 y Statistica - M.Grosso Variabili Aleatorie - Parte 1 10 Variabili aleatorie: Indici di posizione e dispersione • Varianza • È una misura della dispersione della distribuzione intorno al suo valore atteso atteso. Per definizione: σ Y2 = ∑ ( y j − μY ) fY ( y j ) 2 Y discreta j +∞ σ Y2 = ∫ ( y − μY ) fY ( y )dy 2 Y continua −∞ • se esiste. • La varianza è sempre non negativa • Altra grandezza usata per valutare la dispersione della distribuzione è la deviazione standard (ha la stessa unità di misura della media) σ Y = σ Y2 Variabili aleatorie: Indici di dispersione Varianza • Qualitativamente: al diminuire della varianza, la pdf si restringe intorno al suo valore medio • Diminuisce l’incertezza nel processo aleatorio 0.4 Area = 0.95 (1) 0.3 f(x) (2) 1.2 f(x) 0.8 0.2 σ 12 > σ 22 0.1 0.0 -4 -3.2 -2 0 x 1.5 2 4 0.4 0.0 -4 -2 -1.1 x 0 0.4 2 4 L’intervallo di valori in cui gli esiti del processo aleatorio ricadono più frequentemente è molto più ampio nel primo caso che nel secondo Statistica - M.Grosso Variabili Aleatorie - Parte 1 11 Variabili aleatorie: Indici di dispersione – Varianza • Data la variabile aleatoria Y si può facilmente verificare che: [ ] σ Y2 = E (Y − μY ) = E [(Y 2 − 2 μY Y + μY2 )] = E [Y 2 ] − E [2μY Y ] + E [μY2 ] = E [Y 2 ] − 2μY E [Y ] + μY2 = E [Y 2 ] − μY2 2 Variabili aleatorie: Indici di dispersione – Varianza • Teorema di Chebichev: Data una Variabile Aleatoria Y di media μY e varianza σx2 si ha: ∀δ > 0 σ Y2 P ( Y − μY ≥ δ ) ≤ 2 δ • Tale espressione permette qualche ulteriore manipolazione. Sfruttando infatti gli assiomi di Kolmogoroff: σ Y2 P(Y − μY < δ ) = 1 − P (Y − μY ≥ δ ) ≥ 1 − 2 δ σ Y2 P ( Y − μY < δ ) ≥ 1 − 2 δ Statistica - M.Grosso Variabili Aleatorie - Parte 1 ponendo δ=λσY P(Y − μY < λσ Y ) ≥ 1 − 1 λ2 12 Variabili aleatorie: Indici di dispersione – Varianza • Il teorema di Chebichev permette di stabilire in maniera rigorosa che la probabilità che una VA aleatoria cada fuori dall’intervallo [μY−λσY; μY−λσY] (essendo λ una costante arbitraria) è limitato dall’inverso del quadrato di λ. • Questo teorema vale qualunque sia la distribuzioni di Y Variabili aleatorie: Definizione momenti di una distribuzione • Possiamo generalizzare media e varianza con i momenti: ∞ mn = ∫ y f ( y ) dy n −∞ ∞ ∫ ( y − μ ) f ( y ) dy n Mn = momento n-esimo momento centrale n-esimo −∞ • La media è quindi il momento primo della distribuzione, mentre la varianza è il momento centrale di ordine 2. • Si può ò di dimostrare che, h nell caso di f funzioni i id densità i à di probabilità b bili à simmetriche, tutti i momenti centrali di ordine dispari sono nulli. • N.B. E’ possibile valutare i momenti di una distribuzione solo se essi sono definiti. Statistica - M.Grosso Variabili Aleatorie - Parte 1 13 Variabili aleatorie: Indici di asimmetria • Indice di asimmetria (o “skewness”) βY = (d notare (da t che h βY è un numero “puro”) M3 σ 3 Y • Se βY ≠ 0, la funzione di densità presenta una forma asimmetrica β>0 Coda significativa a destra β<0 Coda significativa a sinistra Variabili aleatorie: Indici di curtosi • Indice di Curtosi γY = ( (ancora: γY è un numero “puro”) M4 σ 4 Y • Mira a stabilire se le code della pdf sono significative (leptocurtiche: γ>3) oppure no (platicurtiche γ<3) • Nel primo caso, la probabilità di osservare eventi anche lontani dal trend centrale non è trascurabile VA leptocurtica Statistica - M.Grosso Variabili Aleatorie - Parte 1 VA platicurtica 14