lezione.2.6 - Dipartimento di Scienze Politiche

LEZIONE 2.6
corso di statistica
Francesco Lagona
Università Roma Tre
LEZIONE 2.6 – p. 1/15
variabili aleatorie continue
consideriamo la distribuzione del fatturato mensile in una popolazione di aziende
0.12
•
0.10
0.106
0.06
0.02
0.04
densità
0.08
0.092
0.00
0.002
5
10
15
20
redditi (migliaia di euro)
•
il reddito x di un individuo estratto casualmente da tale popolazione (sotto l’ipotesi
che tutti gli individui hanno la stessa probabilità di essere estratti) è la
determinazione di una variabile aleatoria continua X con densità di probabilità
f (x) =

0







0.106
0.092




0.002




0
x<5
5 ≤ x < 10
10 ≤ x < 15
15 ≤ x < 20
x ≥ 20
LEZIONE 2.6 – p. 2/15
0.12
0.12
dalla densità alla probabilità
0.06
0.08
0.092
0.02
0.02
0.04
0.06
densità
0.08
0.092
0.04
densità
0.106
0.10
0.10
0.106
0.00
0.002
0.00
0.002
5
10
15
redditi (migliaia di euro)
7
P (5 < X < 7) =
Z
14
P (7 < X < 14) =
Z
5
7
20
5
10
15
20
redditi (migliaia di euro)
f (x)dx = 0.106 × (7 − 5) = 0.212
f (x)dx = 0.106 × (10 − 7) + 0.092 × (14 − 10) = 0.686
LEZIONE 2.6 – p. 3/15
0.0
0.2
0.4
F(x)
0.6
0.8
1.0
dalla funzione di ripartizione alla probabilità
0
5
10
15
20
25
x
F (x) =
Z
x
−∞
f (x)dx = P (X ≤ x)
LEZIONE 2.6 – p. 4/15
valore atteso e varianza
EX =
σ2 =
=
Z
+∞
−∞
Z +∞
−∞
Z +∞
−∞
2
xf (x)dx
(x − EX)2 f (x)dx
x2 f (x)dx − E2 X
=EX − E2 X
σ2
P (|X − EX| > ε) ≤ 2
ε
σ2
P (|X − EX| ≤ ε) ≥ 1 − 2
ε
LEZIONE 2.6 – p. 5/15
0.00
0.05
0.10
0.15
densità
0.20
0.25
0.30
0.00
0.05
0.10
0.15
0.25
0.30
0.20
0.25
0.30
0
0
5
5
4 classi
10
x
20 classi
10
x
0.20
15
15
20
20
densità
0.00
0.05
0.10
0.15
densità
0.20
0.25
0.30
0.00
0.05
0.10
0.15
dall’istogramma alla densità normale
densità
0
0
5
5
10 classi
10
x
20 classi
10
x
15
15
20
20
LEZIONE 2.6 – p. 6/15
variabile aleatoria normale
• diciamo che una variabile aleatoria continua X a valori sulla
retta reale (−∞, +∞) si distribuisce come una normale di
parametri µ e σ 2 , e scriviamo
X ∼ N (µ, σ 2 )
se, comunque preso un intervallo della retta (a, b) la
probabilitaà di osservare l’evento (a < X < b) è data da
P (a < X < b) =
Z
b
f (x; µ, σ 2 )dx
a
dove
2
f (x; µ, σ ) = √
1
2πσ 2
e
− 2σ12 (x−µ)2
è una funzione di densità normale di parametri µ e σ 2
LEZIONE 2.6 – p. 7/15
la densità normale
0.15
0.10
0.05
densità di probabilità
0.20
N(µ, σ2)
µ−σ
•
•
µ
µ+σ
la densità normale di parametri µ e σ 2 è una curva di forma campanulare con
◦
punto di massimo assoluto in x = µ
◦
punti di flesso in x = µ ± σ
se X ∼ N (µ, σ 2 ) allora il valore atteso e la varianza di X sono rispettivamenti dati
da µ e σ 2
LEZIONE 2.6 – p. 8/15
al variare della varianza
densità di probabilità
la densità normale
densità di probabilità
0.8
0.6
0.8
0.0
0.2
0.4
0.6
0.4
0.2
0.0
al variare della media
LEZIONE 2.6 – p. 9/15
la normale standardizzata
•
ponendo µ = 0 e σ 2 = 1 si ottiene la densità normale standardizzata N (0, 1):
1 − z2
f (z) = √ e 2
2π
la funzione di ripartizione della normale standardizzata è data da
Z z
1 2
1
√ e− 2 z dz
Φ(z) = P (Z < z) =
2π
−∞
Φ(z)
0.0
0.2
0.1
0.4
0.2
0.6
0.3
0.8
1.0
0.4
N(0,1)
0.0
•
0
z
0
z
LEZIONE 2.6 – p. 10/15
probabilità sotto N(0,1)
•
le tavole della normale contengono i valori di Φ(z) per z > 0
•
per la simmetria della normale N (0, 1) si ha che:
Φ(−z) = 1 − Φ(z)
N(0,1)
0.4
0.3
0.2
0.1
0.0
0.0
0.1
0.2
0.3
0.4
N(0,1)
0
z
−z
0
•
quindi le tavole della normale consentono di conoscere i valori di Φ(z) per
qualunque valore di z
•
se Z ∼ N (0, 1), allora
P (a < Z < b) = P (Z < b) − P (Z < a) = Φ(b) − Φ(a)
LEZIONE 2.6 – p. 11/15
uso della normale standardizzata
•
teorema: se X ∼ N (µ, σ 2 ) allora la variabile Z ottenuta standardizzando la variabile
aleatoria X
X−µ
∼ N (0, 1)
Z=
σ
si distribuisce secondo una normale standardizzata
•
possiamo utilizzare questo risultato per trasformare le aree sotto una qualunque
normale in aree equivalenti sotto la normale standardizzata:
X ∼N (µ, σ 2 )
Z ∼N (0, 1)
a−µ
X −µ
b−µ
a−µ
b−µ
<
<
) = P(
<Z<
)
P (a < X < b) =P (
σ
σ
σ
σ
σ
b−µ
a−µ
=Φ
−Φ
σ
σ
LEZIONE 2.6 – p. 12/15
esempio
•
supponiamo che X ∼ N (10, 4)
•
la probabilità
8 − 10
12 − 10
<Z<
) = P (−1 < Z < 1)
2
2
=Φ(1) − Φ(−1) = Φ(1) − (1 − Φ(1)) = 2Φ(1) − 1 = 2 × 0.8413 − 1 = 0.6826
0.4
P (8 < X < 12) =P (
0.1
0.2
0.3
N(0,1)
0.0
N(0,1)
−6 −4 −2
0
2
4
6
8
10 12 14
LEZIONE 2.6 – p. 13/15
approssimazione della binomiale
•
supponiamo che
X ∼ Bin(n, p)
allora, quando n è molto alto,
Bin(n, p)
quindi
Z
b+0.5
a−0.5
1
p
e
2πnp(1 − p)
1
−2
√ u−np
np(1−p)
du
0.00
0.02
0.04
0.06
0.08
0.10
0.12
0.14
P (a < X < b) ≈
densità
•
≈ N (np, np(1 − p))
5
10
15
20
xxx
LEZIONE 2.6 – p. 14/15
esempio
•
si estraggono con ripetizione n = 100 palline da un un’urna contenente per il 30%
palline blu
•
qual’è la probabilità di ottenere tra 30 e 40 palline blu?
•
X ∼ Bin(100, 0.3)
•
U ∼ N (100 × 0.3, 100 × 0.3 × 0.7)
40 X
100 k 100−k
0.3 0.7
P (30 ≤ X ≤ 40) =
k
k=30
Z 40.5
1 √u−100×0.3
1
−2
100×0.3×0.7 du
√
e
≈
2π100 × 0.3 × 0.7
29.5
40.5 − 100 × 0.3
29.5 − 100 × 0.3
<Z< √
≈ P (29.5 < U < 40.5) = P √
100 × 0.3 × 0.7
100 × 0.3 × 0.7
≈ 0.532
LEZIONE 2.6 – p. 15/15