Esercitazione 2 - Statistica II - Economia Aziendale
Davide Passaretti
16/5/2017
Contents
1 Variabili casuali doppie
1
2 Approssimazione della v.c. Binomiale alla v.c. Normale
2
3 Proprietà riproduttiva della Normale
3
4 Quesiti di riepilogo
4
1
Variabili casuali doppie
Si vuole incrociare la v.c. “numero di test svolti precedentemente in una determinata materia” (X) con la v.c.
“numero di esercizi svolti oggi in un test della stessa materia” (Y ).
numero esercizi svolti al test (Y )
1
2
0.2
0.15
0.175
0.15
0.125
0.2
0.5
0.5
numero test svolti precedentemente (X)
0
1
2
totale
totale
0.35
0.325
0.325
1
a) Calcolare i valori condizionati P(X = 1 Y = 1) e P(Y = 1 X = 2).
0.175
P(X = 1 Y = 1) =
= 0.25
0.5
0.125
P(Y = 1 X = 2) =
= 0.385
0.325
b) Calcolare le medie e le varianze delle due variabili (marginali).
µX = 0 × 0.35 + 1 × 0.325 + 2 × 0.325 = 0.975
µY = 1 × 0.5 + 2 × 0.5 = 1.5
2
σX
= (0 − 0.975) × 0.35 + (1 − 0.975)2 × 0.325 + (2 − 0.975)2 × 0.325 = 0.674
2
σY2 = (1 − 1.5)2 × 0.5 + (2 − 1.5)2 × 0.5 = 0.25
c) Calcolare la media e la varianza di X condizionata ad Y = 2.
0.15
0.2
0.15
+1×
+2×
= 1.1
E(X Y = 2) = 0 ×
0.5
0.5
0.5
0.15
0.15
0.2
Var(X Y = 2) = (0 − 1.1)2 ×
+ (1 − 1.1)2 ×
+ (2 − 1.1)2 ×
= 0.69
0.5
0.5
0.5
d) Sono le due variabili indipendenti?
Le due v.c. sono indipendenti se pij = pi• p•j . Nel nostro caso, se già prendiamo p11 = P (X = 0 ∩ Y = 1) =
0.2, vediamo che non è uguale al prodotto dei corrispondenti marginali: p1• p•1 = 0.35 × 0.5 = 0.7. Le due
v.c. non sono indipendenti.
1
e) Calcolare la correlazione tra le due variabili casuali.
Iniziamo a calcolare la covarianza. La formula alternativa per il calcolo della covarianza è:
Cov(X, Y ) = E(XY ) − E(X) E(Y )
Calcoliamo la media dei prodotti E(XY ):
E(XY ) = 0 × 1 × 0.2 + 1 × 1 × 0.175 + 2 × 1 × 0.125 + 0 × 2 × 0.15 + 1 × 2 × 0.15 + 2 × 2 × 0.2 = 1.525
Calcoliamo il prodotto delle medie E(X) E(Y ):
E(X) E(Y ) = 0.975 × 1.5 = 1.4625
La covarianza risulta quindi:
Cov(X, Y ) = 1.525 − 1.4625 = 0.0625
La correlazione è uguale alla covarianza fratto il prodotto delle devazioni standard:
ρX,Y = √
2
0.0625
√
= 0.152
0.674 × 0.25
Approssimazione della v.c. Binomiale alla v.c. Normale
La v.c. Binomiale può essere approssimata da una Normale se n è grande. Grazie a questa approssimazione,
si può facilmente calcolare per esempio la probabilità di osservare al massimo k successi in n prove, cioè la
funzione di ripartizione (o il suo complemento a 1).
L’approssimazione è la seguente:
X ∼ Bin(n, π) → N(µ = nπ, σ 2 = nπ(1 − π))
Facciamo qualche esempio: Una popolazione è formata dal 40 % delle persone con gli occhi chiari.
a) Qual è la probabilità di osservare meno di 70 persone con gli occhi chiari su 150 estrazioni
indipendenti?
X ∼ N(µ = 150 × 0.4 = 60, σ 2 = 150 × 0.4 × 0.6 = 36)
70 − 60
P(X ≤ 70) = P Z ≤
= Φ(1.67) = 0.95
6
b) Qual è la probabilità di osservare più di 120 persone con gli occhi chiari su 160 estrazioni
indipendenti?
X ∼ N(µ = 160 × 0.4 = 64, σ 2 = 160 × 0.4 × 0.6 = 38.4)
120 − 64
= 1 − Φ(9.04) ≈ 1 − 1 = 0
P(X ≥ 120) = P Z ≥ √
38.4
Prendiamo ora la v.c. “Proporzione di successo”. Essa è ottenibile dividendo la v.c. Binomiale per n.
Tale variabile casuale ha media uguale a π e varianza uguale a π(1−π)
. Grazie a questa variabile casuale
n
possiamo rispondere a domande del tipo: Qual è la probabilità di osservare il 10% dei successi in 50 estrazioni
indipendenti? Quindi non si ragiona più in termini di numero di successi, ma di frequenza di successo.
Anche questa v.c. è approssimabile a una Normale per n grande:
π(1 − π)
X
→ N µ = π, σ 2 =
n
n
2
c) Calcoliamo per esempio la probabilità di osservare più del 45% di persone con gli occhi
chiari in 80 prove indipendenti:
X
0.4 × 0.6
2
∼ N µ = 0.4, σ =
= 0.003
n
80
X
0.45 − 0.4
√
= 1 − Φ(0.91) = 1 − 0.82 = 0.18
P
≥ 0.45 = P Z ≥
n
0.003
3
Proprietà riproduttiva della Normale
La temperatura in una data regione in un dato periodo dell’anno si distribuisce come una Normale con
media 20 °C e varianza 25 °C2 . Si determini come si distribuisce tale temperatura in Fahrenheit,
sapendo che °F = 1.8 °C + 32.
La variabile in Fahrenheit è ancora Normale, dove la media segue la legge di trasformazione degli indici di
posizione, mentre la varianza quella degli indici di variabilità:
µ{°F} = 1.8 × µ{°C} + 32 = 68 °F
2
2
σ{°F}
= 1.82 × σ{°C}
= 81 °F2
Si determini come si distribuisce tale temperatura in Kelvin, sapendo che K = °C + 273.15.
µ{K} = µ{°C} + 273.15 = 293.15 K
2
2
σ{K}
= σ{°C}
= 25 K2
Prendiamo in considerazione le temperature (in questa regione e nello stesso periodo dell’anno) degli ultimi
10 anni, considerandole tra loro indipendenti e supponendo non vi sia stata alterazione sostanziale nelle
temperature. Come si distribuisce la v.c. media delle temperature?
La media di n v.c. Normali indipendenti e con stessa media e varianza è ancora una Normale con media la
media di partenza e varianza la varianza di partenza fratto n. In questo caso:
X 10 ∼ N(µ = 20 °C, σ 2 =
25
= 2.5 °C2 )
10
Supponiamo, invece, che per i primi 5 anni la varianza sia stata 24.4 e negli ultimi 5 anni sia stata 26. Si
determini ancora come si distribuisce la v.c. media delle temperature X 10 .
La variabile risultante è ancora Normale. La media è ancora 20 °C. La varianza in questo caso è:
5 × 24.4 + 5 × 26
252
=
= 2.52 °C2
102
100
3
4
Quesiti di riepilogo
a) In quale caso si può risalire dalla v.c. Binomiale alla Bernoulli?
Ponendo n = 1. Infatti 11 π k (1 − π)1−k è uguale a π per k = 1 e uguale a 1 − π per k = 0.
b) Se X si distribuisce come una Uniforme Continua in un intervallo [a, b], qual è la probabilità
che un evento si verifichi in un punto xout non incluso nell’intervallo? Qual è la probabilità che
l’evento si verifichi in un punto xin incluso nell’intervallo?
Essendo X una v.c. continua, la probabilità in un punto è sempre zero, quindi non ha senso parlare di punto
incluso o meno nell’intervallo [a, b].
c) Come è possibile calcolare la funzione di ripartizione in x per una v.c. discreta?
Sommando le funzioni di probabilità calcolate in tutti i valori fino a x. Per esempio la funzione di ripartizione
di una v.c. Binomiale in x = 2 conta un numero di successi minore o uguale a 2, cioè 0 successi + 1 successo
+ 2 successi.
d) La somma di due v.c. Normali è ancora Normale con media uguale alla somma delle medie
e varianza uguale alla somma delle varianze. Vero o falso?
Falso, poiché ciò è vero solo se sono indipendenti.
4