Econometria lezione 2 Probabilità Econometria lezione 2 AA 2014-2015 Paolo Brunori probabilità e variabili casuali Econometria lezione 2 Probabilità - risultati: esiti potenziali mutualmente esclusivi di un processo causale [numero di goal segnati da Mario Gomez] - probabilità: proporzione delle volte in cui si verifica un risultato nel lungo periodo [Bayern Monaco 2009-13 segna 1 goal: 40/115=0.3478] - spazio campionario: insieme di tutti i risultati possibili [segna 0,1,2,3,.. goal] - evento: sottoinsieme di uno spazio campionario (insieme di risultati) [segna almeno un goal] - variabile casuale: sintesi numerica di un risultato casuale [numero di goal segnati in media per partita: 75/115=0.6521]. distribuzione di probabilità - distribuzione di probabilità di una variabile casuale: elenco di tutti i valori che può assumere con le loro probabilità: Pr(NG=0)=61/115=0.5304 Pr(NG=1)=40/115=0.3478 Pr(NG=2)=10/115=0.0869 Pr(NG=3)=2/115=0.0174 Pr(NG=4)=1/115 = 0.0087 Pr(NG=5)=1/115= 0.0087 Pr(NG=6)=0, ... Econometria lezione 2 Probabilità funzione di ripartizione (c.d.f) Econometria lezione 2 - probabilità di un evento: Probabilità somma delle probabilità di più risultati [Pr(NG<3)=Pr(NG=0)+Pr(NG=1)+Pr(NG=2)=0.6347] - c.d.f.: probabilità che una variabile casuale sia uguale o inferiore a un certo valore distribuzione di Bernoulli Econometria lezione 2 Probabilità - variabile causale binaria (risultati possibili: 0,1) - Gomez segna con probabilità p e non segna con probabilità (1 − p) distribuzione di probabilità di una variabile casuale continua Econometria lezione 2 Probabilità - funzione di ripartizione: probabilità che la variabile casuale sia minore o uguale a un certo valore distribuzione di densità di probabilità Econometria lezione 2 - funzione di densità (p.d.f): l’area sotto la curva fra due valori misura la probabilità che la variabile casuale sia compresa fra i due valori (a=45, b=48) Probabilità valore atteso Econometria lezione 2 Probabilità - valore atteso: valore medio di una variabile casuale Y in un numero elevato di prove: P E(Y ) = y1 p1 + y2 p2 + ... + yk pk = ki=1 yi pi - valore atteso di una variabile casuale di Bernoulli: E(G) = 1 × p + 0 × (1 − p) - valore atteso diR una variabile casuale continua: E(Y ) = µY = yi fY (y) dove fY è la funzione di probabilità di Y dispersione di una distribuzione di probabilità Econometria lezione 2 Probabilità 2 = E[(Y − µ )2 ] = - varianza: σY Y - deviazione standard: σY = q Pk 2 σY i=1 (yi − µY ) 2 p i dispersione di una variable casuale di Bernoulli Econometria lezione 2 Probabilità 2 = (0−p)2 ×(1−p)+(1−p)2 ×p = p(1−p) var(G) = σG σG = p p(1 − p) µ e σ 2 di funzione lineare di una variabile casuale Econometria lezione 2 Probabilità Y= a+ bX - µY = a + bµX 2 = b2 σ 2 - σY X - σY = bσX asimmetria Econometria lezione 2 Probabilità - Asimmetria = E[(Y −µY )3 ] 3 σY - Asimmetria < 0 segnala coda sinistra lunga - Asimmetria > 0 segnala coda destra lunga curtosi Econometria lezione 2 Probabilità - curtosi = E[(Y −µY )4 ] 4 σY - misura la frequenza di outlier - la curtosi di una distribuzione normale è 3 - distribuzione leptocurtica: curtosi > 3 momenti Econometria lezione 2 Probabilità - momento primo di Y : µY - momento secondo µ2Y - momento r-esimo µrY variabili casuali doppie Econometria lezione 2 Probabilità - distribuzione di probabilità congiunta: Pr(X = x, Y = y) segna Y = 0 non segna Y = 1 totale casa X = 0 0.295 0.205 0.5 - Pr(Y = y|X = x) = trasferta X = 1 0.1746 0.3254 0.5 Pr(X=x,Y =y) Pr(X=x) - probabilità che segni in casa: 0.295/0.5 = 0.59 0.4696 0.5304 1 aspettativa condizionata Econometria lezione 2 Probabilità - l’aspettativa condizionata di Y data X (media condizionata) E(Y |X = x) = k X yi Pr(Y = yi |X = x) i=1 - goal attesi in trasferta: Pr(NG = 1|X = 1) + Pr(NG = 2|X = 1) × 2 + Pr(NG = 3|X = 1) × 3 + Pr(NG = 4|X = 1) × 4 + ... legge delle aspettative iterate Econometria lezione 2 Probabilità se x può assumere valori 1, ..., l l X E(Y ) = E(Y |X = xi )Pr(X = xi ) i=1 che è equivalente a: E(Y ) = E[E(Y |X )] la media dei goal di Gomez è pari alla media ponderata dei goal attesi in trasferta e in casa legge delle aspettative iterate cnt. Econometria lezione 2 Probabilità - valida nel caso di variabili casuali multiple: X, Y, Z - esempio: numero di goal (Y); in trasferta, in casa (X); in coppa, in campionato (Z) - media goal = media ponderata dei goal segnati in casa e in trasferta sia in coppa che in campionato varianza condizionata Econometria lezione 2 Probabilità var(Y |X = x) = k X i=1 (yi −E(Y |X = x)]2 )×Pr(Y = yi |X = x) indipendenza Econometria lezione 2 Probabilità - due variabili casuali sono dette indipendenti quanto conoscere il valore d una non fornisce alcuna informazione riguardo l’altra Pr(Y = y|X = x) = Pr(Y = y) equivalente a Pr(X = x, Y = y) = Pr(X = x) × Pr(Y = y) covarianza Econometria lezione 2 Probabilità - misura l’intensità con la quale due variabili si muovono insieme cov(X , Y ) = σXY = E[(X − µX )(Y − µY )] σXY = k X l X (xj − µX )(yi − µY ) i=1 j=1 - −∞ < σXY < +∞ - se X ⊥ Y → σXY = 0 correlazione Econometria lezione 2 Probabilità - una misura indipendente dall’unità di misura cov(X , Y ) σ(X , Y ) corr(X , Y ) = p var(X )var(Y ) σX σY - le unità di misura si annullano a denominatore e numeratore - −1 < corr(XY ) < +1 distribuzione normale Econometria lezione 2 Probabilità - p.d.f. di forma campanulare N ∼ (µ, σ 2 ) - simmetrica attorno alla media - il 95% della probabilità è concentrata fra i valori: µ − 1.96σ, µ + 1.96σ - distribuzione normale standardizzata: Z = N ∼ (0, 1) - Pr(Z ≤ c) = Φ(c) [tavole] - ogni variabile casuale può essere standardizzata: sottraendo la media e dividendo il risultato per la deviazione standard - se Y = N (1, 4) e ci interessa Pr(Y ≤ 2) 2−1 √ - dobbiamo trovare Φ( 2−µ σ ) = Φ( 4 ) = Φ(0.5) = 0.691