Esercitazione 2 - Statistica II - Economia Aziendale Davide Passaretti 16/5/2017 Contents 1 Variabili casuali doppie 1 2 Approssimazione della v.c. Binomiale alla v.c. Normale 2 3 Proprietà riproduttiva della Normale 3 4 Quesiti di riepilogo 4 1 Variabili casuali doppie Si vuole incrociare la v.c. “numero di test svolti precedentemente in una determinata materia” (X) con la v.c. “numero di esercizi svolti oggi in un test della stessa materia” (Y ). numero esercizi svolti al test (Y ) 1 2 0.2 0.15 0.175 0.15 0.125 0.2 0.5 0.5 numero test svolti precedentemente (X) 0 1 2 totale totale 0.35 0.325 0.325 1 a) Calcolare i valori condizionati P(X = 1 Y = 1) e P(Y = 1 X = 2). 0.175 P(X = 1 Y = 1) = = 0.25 0.5 0.125 P(Y = 1 X = 2) = = 0.385 0.325 b) Calcolare le medie e le varianze delle due variabili (marginali). µX = 0 × 0.35 + 1 × 0.325 + 2 × 0.325 = 0.975 µY = 1 × 0.5 + 2 × 0.5 = 1.5 2 σX = (0 − 0.975) × 0.35 + (1 − 0.975)2 × 0.325 + (2 − 0.975)2 × 0.325 = 0.674 2 σY2 = (1 − 1.5)2 × 0.5 + (2 − 1.5)2 × 0.5 = 0.25 c) Calcolare la media e la varianza di X condizionata ad Y = 2. 0.15 0.2 0.15 +1× +2× = 1.1 E(X Y = 2) = 0 × 0.5 0.5 0.5 0.15 0.15 0.2 Var(X Y = 2) = (0 − 1.1)2 × + (1 − 1.1)2 × + (2 − 1.1)2 × = 0.69 0.5 0.5 0.5 d) Sono le due variabili indipendenti? Le due v.c. sono indipendenti se pij = pi• p•j . Nel nostro caso, se già prendiamo p11 = P (X = 0 ∩ Y = 1) = 0.2, vediamo che non è uguale al prodotto dei corrispondenti marginali: p1• p•1 = 0.35 × 0.5 = 0.7. Le due v.c. non sono indipendenti. 1 e) Calcolare la correlazione tra le due variabili casuali. Iniziamo a calcolare la covarianza. La formula alternativa per il calcolo della covarianza è: Cov(X, Y ) = E(XY ) − E(X) E(Y ) Calcoliamo la media dei prodotti E(XY ): E(XY ) = 0 × 1 × 0.2 + 1 × 1 × 0.175 + 2 × 1 × 0.125 + 0 × 2 × 0.15 + 1 × 2 × 0.15 + 2 × 2 × 0.2 = 1.525 Calcoliamo il prodotto delle medie E(X) E(Y ): E(X) E(Y ) = 0.975 × 1.5 = 1.4625 La covarianza risulta quindi: Cov(X, Y ) = 1.525 − 1.4625 = 0.0625 La correlazione è uguale alla covarianza fratto il prodotto delle devazioni standard: ρX,Y = √ 2 0.0625 √ = 0.152 0.674 × 0.25 Approssimazione della v.c. Binomiale alla v.c. Normale La v.c. Binomiale può essere approssimata da una Normale se n è grande. Grazie a questa approssimazione, si può facilmente calcolare per esempio la probabilità di osservare al massimo k successi in n prove, cioè la funzione di ripartizione (o il suo complemento a 1). L’approssimazione è la seguente: X ∼ Bin(n, π) → N(µ = nπ, σ 2 = nπ(1 − π)) Facciamo qualche esempio: Una popolazione è formata dal 40 % delle persone con gli occhi chiari. a) Qual è la probabilità di osservare meno di 70 persone con gli occhi chiari su 150 estrazioni indipendenti? X ∼ N(µ = 150 × 0.4 = 60, σ 2 = 150 × 0.4 × 0.6 = 36) 70 − 60 P(X ≤ 70) = P Z ≤ = Φ(1.67) = 0.95 6 b) Qual è la probabilità di osservare più di 120 persone con gli occhi chiari su 160 estrazioni indipendenti? X ∼ N(µ = 160 × 0.4 = 64, σ 2 = 160 × 0.4 × 0.6 = 38.4) 120 − 64 = 1 − Φ(9.04) ≈ 1 − 1 = 0 P(X ≥ 120) = P Z ≥ √ 38.4 Prendiamo ora la v.c. “Proporzione di successo”. Essa è ottenibile dividendo la v.c. Binomiale per n. Tale variabile casuale ha media uguale a π e varianza uguale a π(1−π) . Grazie a questa variabile casuale n possiamo rispondere a domande del tipo: Qual è la probabilità di osservare il 10% dei successi in 50 estrazioni indipendenti? Quindi non si ragiona più in termini di numero di successi, ma di frequenza di successo. Anche questa v.c. è approssimabile a una Normale per n grande: π(1 − π) X → N µ = π, σ 2 = n n 2 c) Calcoliamo per esempio la probabilità di osservare più del 45% di persone con gli occhi chiari in 80 prove indipendenti: X 0.4 × 0.6 2 ∼ N µ = 0.4, σ = = 0.003 n 80 X 0.45 − 0.4 √ = 1 − Φ(0.91) = 1 − 0.82 = 0.18 P ≥ 0.45 = P Z ≥ n 0.003 3 Proprietà riproduttiva della Normale La temperatura in una data regione in un dato periodo dell’anno si distribuisce come una Normale con media 20 °C e varianza 25 °C2 . Si determini come si distribuisce tale temperatura in Fahrenheit, sapendo che °F = 1.8 °C + 32. La variabile in Fahrenheit è ancora Normale, dove la media segue la legge di trasformazione degli indici di posizione, mentre la varianza quella degli indici di variabilità: µ{°F} = 1.8 × µ{°C} + 32 = 68 °F 2 2 σ{°F} = 1.82 × σ{°C} = 81 °F2 Si determini come si distribuisce tale temperatura in Kelvin, sapendo che K = °C + 273.15. µ{K} = µ{°C} + 273.15 = 293.15 K 2 2 σ{K} = σ{°C} = 25 K2 Prendiamo in considerazione le temperature (in questa regione e nello stesso periodo dell’anno) degli ultimi 10 anni, considerandole tra loro indipendenti e supponendo non vi sia stata alterazione sostanziale nelle temperature. Come si distribuisce la v.c. media delle temperature? La media di n v.c. Normali indipendenti e con stessa media e varianza è ancora una Normale con media la media di partenza e varianza la varianza di partenza fratto n. In questo caso: X 10 ∼ N(µ = 20 °C, σ 2 = 25 = 2.5 °C2 ) 10 Supponiamo, invece, che per i primi 5 anni la varianza sia stata 24.4 e negli ultimi 5 anni sia stata 26. Si determini ancora come si distribuisce la v.c. media delle temperature X 10 . La variabile risultante è ancora Normale. La media è ancora 20 °C. La varianza in questo caso è: 5 × 24.4 + 5 × 26 252 = = 2.52 °C2 102 100 3 4 Quesiti di riepilogo a) In quale caso si può risalire dalla v.c. Binomiale alla Bernoulli? Ponendo n = 1. Infatti 11 π k (1 − π)1−k è uguale a π per k = 1 e uguale a 1 − π per k = 0. b) Se X si distribuisce come una Uniforme Continua in un intervallo [a, b], qual è la probabilità che un evento si verifichi in un punto xout non incluso nell’intervallo? Qual è la probabilità che l’evento si verifichi in un punto xin incluso nell’intervallo? Essendo X una v.c. continua, la probabilità in un punto è sempre zero, quindi non ha senso parlare di punto incluso o meno nell’intervallo [a, b]. c) Come è possibile calcolare la funzione di ripartizione in x per una v.c. discreta? Sommando le funzioni di probabilità calcolate in tutti i valori fino a x. Per esempio la funzione di ripartizione di una v.c. Binomiale in x = 2 conta un numero di successi minore o uguale a 2, cioè 0 successi + 1 successo + 2 successi. d) La somma di due v.c. Normali è ancora Normale con media uguale alla somma delle medie e varianza uguale alla somma delle varianze. Vero o falso? Falso, poiché ciò è vero solo se sono indipendenti. 4