Econometria
lezione 2
Probabilità
Econometria
lezione 2
AA 2014-2015
Paolo Brunori
probabilità e variabili casuali
Econometria
lezione 2
Probabilità
- risultati: esiti potenziali mutualmente esclusivi di
un processo causale [numero di goal segnati da Mario
Gomez]
- probabilità: proporzione delle volte in cui si verifica
un risultato nel lungo periodo [Bayern Monaco
2009-13 segna 1 goal: 40/115=0.3478]
- spazio campionario: insieme di tutti i risultati
possibili [segna 0,1,2,3,.. goal]
- evento: sottoinsieme di uno spazio campionario
(insieme di risultati) [segna almeno un goal]
- variabile casuale: sintesi numerica di un risultato
casuale [numero di goal segnati in media per partita:
75/115=0.6521].
distribuzione di probabilità
- distribuzione di probabilità di una variabile
casuale: elenco di tutti i valori che può assumere
con le loro probabilità:
Pr(NG=0)=61/115=0.5304
Pr(NG=1)=40/115=0.3478
Pr(NG=2)=10/115=0.0869
Pr(NG=3)=2/115=0.0174
Pr(NG=4)=1/115 = 0.0087
Pr(NG=5)=1/115= 0.0087
Pr(NG=6)=0, ...
Econometria
lezione 2
Probabilità
funzione di ripartizione (c.d.f)
Econometria
lezione 2
- probabilità di un evento:
Probabilità
somma delle probabilità di più risultati
[Pr(NG<3)=Pr(NG=0)+Pr(NG=1)+Pr(NG=2)=0.6347]
- c.d.f.: probabilità che una variabile casuale sia
uguale o inferiore a un certo valore
distribuzione di Bernoulli
Econometria
lezione 2
Probabilità
- variabile causale binaria (risultati possibili: 0,1)
- Gomez segna con probabilità p e non segna con
probabilità (1 − p)
distribuzione di probabilità di una
variabile casuale continua
Econometria
lezione 2
Probabilità
- funzione di ripartizione: probabilità che la
variabile casuale sia minore o uguale a un certo valore
distribuzione di densità di probabilità
Econometria
lezione 2
- funzione di densità (p.d.f): l’area sotto la curva
fra due valori misura la probabilità che la variabile
casuale sia compresa fra i due valori (a=45, b=48)
Probabilità
valore atteso
Econometria
lezione 2
Probabilità
- valore atteso: valore medio di una variabile casuale
Y in un numero elevato di prove:
P
E(Y ) = y1 p1 + y2 p2 + ... + yk pk = ki=1 yi pi
- valore atteso di una variabile casuale di Bernoulli:
E(G) = 1 × p + 0 × (1 − p)
- valore atteso diR una variabile casuale continua:
E(Y ) = µY = yi fY (y)
dove fY è la funzione di probabilità di Y
dispersione di una distribuzione di
probabilità
Econometria
lezione 2
Probabilità
2 = E[(Y − µ )2 ] =
- varianza: σY
Y
- deviazione standard: σY =
q
Pk
2
σY
i=1 (yi
− µY ) 2 p i
dispersione di una variable casuale di
Bernoulli
Econometria
lezione 2
Probabilità
2 = (0−p)2 ×(1−p)+(1−p)2 ×p = p(1−p)
var(G) = σG
σG =
p
p(1 − p)
µ e σ 2 di funzione lineare di una variabile
casuale
Econometria
lezione 2
Probabilità
Y= a+ bX
- µY = a + bµX
2 = b2 σ 2
- σY
X
- σY = bσX
asimmetria
Econometria
lezione 2
Probabilità
- Asimmetria =
E[(Y −µY )3 ]
3
σY
- Asimmetria < 0 segnala coda sinistra lunga
- Asimmetria > 0 segnala coda destra lunga
curtosi
Econometria
lezione 2
Probabilità
- curtosi =
E[(Y −µY )4 ]
4
σY
- misura la frequenza di outlier
- la curtosi di una distribuzione normale è 3
- distribuzione leptocurtica: curtosi > 3
momenti
Econometria
lezione 2
Probabilità
- momento primo di Y : µY
- momento secondo µ2Y
- momento r-esimo µrY
variabili casuali doppie
Econometria
lezione 2
Probabilità
- distribuzione di probabilità congiunta:
Pr(X = x, Y = y)
segna Y = 0
non segna Y = 1
totale
casa X = 0
0.295
0.205
0.5
- Pr(Y = y|X = x) =
trasferta X = 1
0.1746
0.3254
0.5
Pr(X=x,Y =y)
Pr(X=x)
- probabilità che segni in casa: 0.295/0.5 = 0.59
0.4696
0.5304
1
aspettativa condizionata
Econometria
lezione 2
Probabilità
- l’aspettativa condizionata di Y data X (media
condizionata)
E(Y |X = x) =
k
X
yi Pr(Y = yi |X = x)
i=1
- goal attesi in trasferta:
Pr(NG = 1|X = 1) + Pr(NG = 2|X = 1) × 2 + Pr(NG =
3|X = 1) × 3 + Pr(NG = 4|X = 1) × 4 + ...
legge delle aspettative iterate
Econometria
lezione 2
Probabilità
se x può assumere valori 1, ..., l
l
X
E(Y ) =
E(Y |X = xi )Pr(X = xi )
i=1
che è equivalente a:
E(Y ) = E[E(Y |X )]
la media dei goal di Gomez è pari alla media ponderata
dei goal attesi in trasferta e in casa
legge delle aspettative iterate cnt.
Econometria
lezione 2
Probabilità
- valida nel caso di variabili casuali multiple: X, Y, Z
- esempio: numero di goal (Y); in trasferta, in casa
(X); in coppa, in campionato (Z)
- media goal = media ponderata dei goal segnati in
casa e in trasferta sia in coppa che in campionato
varianza condizionata
Econometria
lezione 2
Probabilità
var(Y |X = x) =
k
X
i=1
(yi −E(Y |X = x)]2 )×Pr(Y = yi |X = x)
indipendenza
Econometria
lezione 2
Probabilità
- due variabili casuali sono dette indipendenti quanto
conoscere il valore d una non fornisce alcuna
informazione riguardo l’altra
Pr(Y = y|X = x) = Pr(Y = y)
equivalente a
Pr(X = x, Y = y) = Pr(X = x) × Pr(Y = y)
covarianza
Econometria
lezione 2
Probabilità
- misura l’intensità con la quale due variabili si
muovono insieme
cov(X , Y ) = σXY = E[(X − µX )(Y − µY )]
σXY =
k X
l
X
(xj − µX )(yi − µY )
i=1 j=1
- −∞ < σXY < +∞
- se X ⊥ Y → σXY = 0
correlazione
Econometria
lezione 2
Probabilità
- una misura indipendente dall’unità di misura
cov(X , Y )
σ(X , Y )
corr(X , Y ) = p
var(X )var(Y ) σX σY
- le unità di misura si annullano a denominatore e
numeratore
- −1 < corr(XY ) < +1
distribuzione normale
Econometria
lezione 2
Probabilità
- p.d.f. di forma campanulare N ∼
(µ, σ 2 )
- simmetrica attorno alla media
- il 95% della probabilità è concentrata fra i valori:
µ − 1.96σ, µ + 1.96σ
- distribuzione normale standardizzata: Z = N ∼ (0, 1)
- Pr(Z ≤ c) = Φ(c) [tavole]
- ogni variabile casuale può essere standardizzata:
sottraendo la media e dividendo il risultato per la
deviazione standard
- se Y = N (1, 4) e ci interessa Pr(Y ≤ 2)
2−1
√
- dobbiamo trovare Φ( 2−µ
σ ) = Φ( 4 ) = Φ(0.5) = 0.691