Variabili aleatorie – Parte I
• Variabili aleatorie Scalari - Definizione
• Funzioni di distribuzione di una VA
• Funzioni densità di probabilità di una VA
• Indici di posizione di una distribuzione
• Indici di dispersione di una distribuzione
• Definizione Momenti di una distribuzione
Teoria della Probabilità
Variabile aleatoria - Definizione
• Una variabile aleatoria è una
funzione che associa ad
ogni esito di un processo
aleatorio
(nell’esempio, una certa faccia
del dado)
un distinto numero reale
(nel nostro caso un numero
intero compreso tra 1 e 6).
• Associare ad un processo aleatorio (scalare) un numero reale è un
procedimento che facciamo spesso in modo intuitivo
Statistica - M.Grosso
Variabili Aleatorie - Parte 1
1
Variabili aleatorie – Definizione
• Una variabile aleatoria è una funzione che associa ad ogni esito
di un processo aleatorio, un distinto numero reale
Ω
Variabile
aleatoria
Y
Insieme dei possibili risultati
nello spazio campione Ω
• In termini rigorosi
Y : ω œ Ω Ø y=Y(ω) œ Ψ
Ψ
Insieme valori numerici
che assume la funzione Y
Si definisce pertanto una nuova funzione
probabilità il cui spazio campione è il
codominio Ψ della funzione Y
Variabili aleatorie - Definizione
• La variabile aleatoria Y è una funzione che assume valori tali che
dipendono dal “caso”
• Proprietà:
– Y è definita nello spazio Ω degli esperimenti ed assume valori
nello spazio campione Ψ (codominio) sottoinsieme dei numeri
reali.
– Qualunque sottoinsieme del codominio Ψ (evento) ha una
probabilità ben definita di accadere
– Tale concetto di probabilità deve essere coerente con gli
assiomi di Kolmogoroff
• Nel seguito, si indicherà con
• Y la variabile aleatoria
• y l’esito della singola esperienza della variabile aleatoria
Statistica - M.Grosso
Variabili Aleatorie - Parte 1
2
Variabili aleatorie – Definizione
• Da notare che Y è una funzione (variabile aleatoria) mentre i
valori assunti da tale funzione y=Y(ω), valori calcolabili quando
l’esito dell’esperimento sia noto, sono numeri reali
• Nel seguito:
Y
y
→
→
variabile aleatoria
singolo esito osservato della VA
Variabili aleatorie - Definizione
• L’opportunità di associare ad ogni esito di un processo stocastico
un numero reale semplifica la rappresentazione degli eventi
aleatori e la loro manipolazione matematica.
matematica
• È possibile, per esempio, introdurre una relazione d’ordine nel
codominio dello spazio degli eventi.
• In particolare data una variabile aleatoria Y(ω) è possibile, per
ogni y0, definire un evento (in genere non elementare) così fatto:
Ay = {ω Y (ω ) ≤ y0 }∈ S
0
• Questo implica che è possibile definire la probabilità per ogni
insieme del tipo:
I ( y0 ) = {y ≤ y0 }
Statistica - M.Grosso
Variabili Aleatorie - Parte 1
3
Funzioni di distribuzione di una VA scalare
• Si può facilmente dimostrare che per ogni variabile aleatoria Y la
funzione (reale di una variabile reale) distribuzione di
probabilità (CDF: Cumulative Distribution Function)
FY(y0)= P{Y ≤ y0}
è sufficiente per definire la probabilità di un qualunque evento
pertinente alla variabile aleatorio.
Funzioni distribuzione di una VA scalare
•
Proprietà della distribuzione di probabilità
1. FY(+ ∞) = 1, FY(-∞) = 0
2. FY è una funzione non decrescente
3. Se FY(y0)=0 allora FY(y)=0 se y <y0
4. P {Y >y1 } = 1- FY(y1)
5 FY è una funzione
5.
f
i
continua
i
da
d destra:
d
FY(y
( +) = FY(y)
( )
6. P {y1 < Y ≤ y2} = FY(y2)-FY(y1)
•
Da notare che molte proprietà sono una diretta conseguenza
degli assiomi di Kolmogoroff e derivati
Statistica - M.Grosso
Variabili Aleatorie - Parte 1
4
Funzioni distribuzione di una VA scalare
• Esempio - Proprietà 1:
• FY(+¶)
( ) = P{Y(ω)≤+¶}
P{Y( )
} = P{Y œ Ψ} = P{ωœ
P{
Ω} 1
Ω}=1
• Analogamente:
• FY(- ∞) = P{Y ≤ -∞} = P(Y œ Ø)= 0
•Esempio - Proprietà 6:
P {y1 < Y ≤ y2} = FY(y2)-FY(y1)
{Y ≤ y1 } e {y
{ 1 <Y
Y ≤ y2} sono disgiunti.
di i ti D’altra
D’ lt parte,
t
{Y ≤ y2}= {Y ≤ y1 } ∪ { y1 <Y ≤ y2} da cui si deduce la proprietà.
Nota la FY(y) siamo in grado di ricavare la probabilità di
qualunque evento
Funzioni distribuzione di una VA scalare
• Esempio di calcolo di probabilità di un evento dalla funzione di
distribuzione.
Calcolo probabilità
evento A
A = A1 » A2
FY(d)
FY(c)
FY(b)
A1 … A2 = Ø
FY(a)
P{y œ A} =P{y œ A1}+P{y œ A2}
=FY(b)-FY(a)+
FY(d)-FY(c)
Statistica - M.Grosso
Variabili Aleatorie - Parte 1
a
b c
d
y
A1
A2
5
Funzioni distribuzione di una VA scalare (Caso
Discreto)
• Esempio: Lancio dei dadi
F è una funzione a
gradini
dini nel
n l caso
s
discreto
1,0
F(x)
0,8
0,6
È comunque una
funzione continua a
destra
0,4
0,2
0,0
0
1
2
3
4
5
6
7
x
F crescente
0 ≤ F (y) ≤ 1
• Proprietà:
F(y) = 0 per ogni y minore del più
piccolo valore nello spazio di X
Funzioni di densità di probabilità di una
VA scalare
•
In molte circostanze, per la caratterizzazione delle variabili
aleatorie è molto più utile ricorrere alla derivata della funzione
di distribuzione
fY ( y ) =
•
•
y
d
FY ( y ) ovvero FY ( y ) = ∫ f ( u ) du
dy
−∞
La funzione fY(y) prende il nome di funzione densità di
probabilità (pdf)
Proprietà della funzione densità di probabilità
1. fY(y) ≥ 0 sempre
+∞
2.
∫ f (ξ ) dξ = 1
−∞
3. F ( y2 ) − F ( y1 ) =
y2
∫ f (ξ ) d ξ
y1
Statistica - M.Grosso
Variabili Aleatorie - Parte 1
6
Funzioni densità di probabilità di una VA
scalare
• Esempio di calcolo di probabilità di un evento dalla funzione
densità di probabilità
fY(y)
P ( y ∈ A) =
P( y ∈ A1 ) + P( y ∈ A2 ) =
∫ fY ( y )dy + ∫ fY ( y )dy =
A1
A2
∫ fY ( y )dy + ∫ fY ( y )dy
b
d
a
c
a
b c
d
y
A1
A2
Funzioni densità di probabilità di una VA
scalare
• Nei casi di maggiore interesse la variabile aleatoria Y è di tipo
continuo, ovvero può assumere un qualunque valore lungo
l’intervallo in cui è definito
• In tal caso la funzione di distribuzione è una funzione di tipo
continua e la probabilità che si verifichi un evento elementare è
pari a zero:
ω −δ
(F (ω ) − F (ω − δ )) = ∫ fY ( y )dy = 0
P(Y = ω ) = lim
δ →0
ω
Statistica - M.Grosso
Variabili Aleatorie - Parte 1
7
Funzioni densità di probabilità di una VA
scalare
• Nel caso di Variabile Aleatoria discreta, la definizione cambia:
⎧ P(Y = yi ) per y = yi ⎫
fY ( y ) = ⎨
⎬ = P(Y = y )
0
per y ≠ yi ⎭
⎩
P2
fY
P1
Ovviamente:
P3
y1
y2
y3
…
…
Pn
n
∑ Pi = 1
i =1
yn
Variabili aleatorie: Indici di posizione e
dispersione
• Media (o valore atteso)
• Il valore medio di una variabile aleatoria è dato da:
μY = ∑ y j f Y ( y j )
Y discreta
j
+∞
μY = ∫ y fY ( y )dy
Y continua
−∞
• Tale valore p
prende anche il nome di VALORE ATTESO della
variabile aleatoria Y ed è indicato con il simbolo
μY=E(Y)
Statistica - M.Grosso
Variabili Aleatorie - Parte 1
8
Variabili aleatorie: Indici di posizione e
dispersione
• La media esiste solo se esiste finito la seguente quantità:
∑ y j fY ( y j )
Y discreta
j
+∞
∫ y fY ( y ) dy
Y continua
−∞
• Se una distribuzione è simmetrica rispetto a y=c, (f(c+y)=f(c-y))
sii vede
d che
h μ=c
Variabili aleatorie: Indici di posizione e
dispersione
FY (m ) =
1
2
0.5
Area = 0.5
05
0.4
0.3
fY(y)
• Altre misure del trend centrale:
• Mediana di una variabile aleatoria Y
• Il valore m per cui:
Area = 0.5
0.2
0.1
• Moda di una variabile aleatoria Y
• Il valore c per cui la funzione densità di
probabilità assume valore massimo:
0.0
0
2
Mediana
4
fY max
fY(y) max
0.3
fY(y)
• Se la distribuzione è simmetrica, media e
mediana coincidono.
8
0.5
0.4
c:
6
y
0.2
0.1
0.0
0
Statistica - M.Grosso
Variabili Aleatorie - Parte 1
2
Moda
4
y
6
8
9
Variabili aleatorie: Indici di posizione e
dispersione
• Nel caso generale di distribuzioni non simmetriche media,
mediana e moda non coincidono
Moda
0.5
Mediana
0.4
Media
fY(y)
0.3
0.2
0.1
0.0
0
2
4
y
6
8
Variabili aleatorie: Indici di posizione e
dispersione
• Una generalizzazione del concetto di
mediana è il percentile ovvero il valore
qα tale che:
FY (qα ) = α
25mo percentile
0.5
0.4
FY (qα ) = 0.25
0.3
fY(y)
• Esempio: il 25mo percentile è il valore
q0.25 tale che:
0.2
0.1
0.0
-4
-2
0
2
4
y
Statistica - M.Grosso
Variabili Aleatorie - Parte 1
10
Variabili aleatorie: Indici di posizione e
dispersione
• Varianza
• È una misura della dispersione della distribuzione intorno al suo
valore atteso
atteso. Per definizione:
σ Y2 = ∑ ( y j − μY ) fY ( y j )
2
Y discreta
j
+∞
σ Y2 = ∫ ( y − μY ) fY ( y )dy
2
Y continua
−∞
• se esiste.
• La varianza è sempre non negativa
• Altra grandezza usata per valutare la dispersione della
distribuzione è la deviazione standard (ha la stessa unità di
misura della media)
σ Y = σ Y2
Variabili aleatorie: Indici di dispersione Varianza
• Qualitativamente: al diminuire della varianza, la pdf si restringe
intorno al suo valore medio
• Diminuisce l’incertezza nel processo aleatorio
0.4
Area
=
0.95
(1)
0.3
f(x)
(2)
1.2
f(x)
0.8
0.2
σ 12 > σ 22
0.1
0.0
-4
-3.2
-2
0
x
1.5
2
4
0.4
0.0
-4
-2
-1.1 x
0 0.4
2
4
L’intervallo di valori in cui gli esiti del processo aleatorio ricadono più
frequentemente è molto più ampio nel primo caso che nel secondo
Statistica - M.Grosso
Variabili Aleatorie - Parte 1
11
Variabili aleatorie: Indici di dispersione –
Varianza
• Data la variabile aleatoria Y si può facilmente verificare che:
[
]
σ Y2 = E (Y − μY )
= E [(Y 2 − 2 μY Y + μY2 )]
= E [Y 2 ] − E [2μY Y ] + E [μY2 ]
= E [Y 2 ] − 2μY E [Y ] + μY2 = E [Y 2 ] − μY2
2
Variabili aleatorie: Indici di dispersione –
Varianza
• Teorema di Chebichev: Data una Variabile Aleatoria Y di media
μY e varianza σx2 si ha:
∀δ > 0
σ Y2
P ( Y − μY ≥ δ ) ≤ 2
δ
• Tale espressione permette qualche ulteriore manipolazione.
Sfruttando infatti gli assiomi di Kolmogoroff:
σ Y2
P(Y − μY < δ ) = 1 − P (Y − μY ≥ δ ) ≥ 1 − 2
δ
σ Y2
P ( Y − μY < δ ) ≥ 1 − 2
δ
Statistica - M.Grosso
Variabili Aleatorie - Parte 1
ponendo
δ=λσY
P(Y − μY < λσ Y ) ≥ 1 −
1
λ2
12
Variabili aleatorie: Indici di dispersione –
Varianza
• Il teorema di Chebichev permette di stabilire in maniera
rigorosa che la probabilità che una VA aleatoria cada fuori
dall’intervallo [μY−λσY; μY−λσY] (essendo λ una costante
arbitraria) è limitato dall’inverso del quadrato di λ.
• Questo teorema vale qualunque sia la distribuzioni di Y
Variabili aleatorie: Definizione momenti di
una distribuzione
• Possiamo generalizzare media e varianza con i momenti:
∞
mn =
∫ y f ( y ) dy
n
−∞
∞
∫ ( y − μ ) f ( y ) dy
n
Mn =
momento n-esimo
momento centrale n-esimo
−∞
• La media è quindi il momento primo della distribuzione, mentre la
varianza è il momento centrale di ordine 2.
• Si può
ò di
dimostrare che,
h nell caso di f
funzioni
i id
densità
i à di probabilità
b bili à
simmetriche, tutti i momenti centrali di ordine dispari sono nulli.
• N.B. E’ possibile valutare i momenti di una distribuzione solo se
essi sono definiti.
Statistica - M.Grosso
Variabili Aleatorie - Parte 1
13
Variabili aleatorie: Indici di asimmetria
• Indice di asimmetria (o “skewness”)
βY =
(d notare
(da
t
che
h βY è un
numero “puro”)
M3
σ
3
Y
• Se βY ≠ 0, la funzione di densità presenta una forma asimmetrica
β>0
Coda significativa a
destra
β<0
Coda significativa a
sinistra
Variabili aleatorie: Indici di curtosi
• Indice di Curtosi
γY =
(
(ancora:
γY è un numero
“puro”)
M4
σ
4
Y
• Mira a stabilire se le code della pdf sono significative
(leptocurtiche: γ>3) oppure no (platicurtiche γ<3)
• Nel primo caso, la probabilità di osservare eventi anche lontani
dal trend centrale non è trascurabile
VA
leptocurtica
Statistica - M.Grosso
Variabili Aleatorie - Parte 1
VA
platicurtica
14