LEZIONE 2.6 corso di statistica Francesco Lagona Università Roma Tre LEZIONE 2.6 – p. 1/15 variabili aleatorie continue consideriamo la distribuzione del fatturato mensile in una popolazione di aziende 0.12 • 0.10 0.106 0.06 0.02 0.04 densità 0.08 0.092 0.00 0.002 5 10 15 20 redditi (migliaia di euro) • il reddito x di un individuo estratto casualmente da tale popolazione (sotto l’ipotesi che tutti gli individui hanno la stessa probabilità di essere estratti) è la determinazione di una variabile aleatoria continua X con densità di probabilità f (x) = 0 0.106 0.092 0.002 0 x<5 5 ≤ x < 10 10 ≤ x < 15 15 ≤ x < 20 x ≥ 20 LEZIONE 2.6 – p. 2/15 0.12 0.12 dalla densità alla probabilità 0.06 0.08 0.092 0.02 0.02 0.04 0.06 densità 0.08 0.092 0.04 densità 0.106 0.10 0.10 0.106 0.00 0.002 0.00 0.002 5 10 15 redditi (migliaia di euro) 7 P (5 < X < 7) = Z 14 P (7 < X < 14) = Z 5 7 20 5 10 15 20 redditi (migliaia di euro) f (x)dx = 0.106 × (7 − 5) = 0.212 f (x)dx = 0.106 × (10 − 7) + 0.092 × (14 − 10) = 0.686 LEZIONE 2.6 – p. 3/15 0.0 0.2 0.4 F(x) 0.6 0.8 1.0 dalla funzione di ripartizione alla probabilità 0 5 10 15 20 25 x F (x) = Z x −∞ f (x)dx = P (X ≤ x) LEZIONE 2.6 – p. 4/15 valore atteso e varianza EX = σ2 = = Z +∞ −∞ Z +∞ −∞ Z +∞ −∞ 2 xf (x)dx (x − EX)2 f (x)dx x2 f (x)dx − E2 X =EX − E2 X σ2 P (|X − EX| > ε) ≤ 2 ε σ2 P (|X − EX| ≤ ε) ≥ 1 − 2 ε LEZIONE 2.6 – p. 5/15 0.00 0.05 0.10 0.15 densità 0.20 0.25 0.30 0.00 0.05 0.10 0.15 0.25 0.30 0.20 0.25 0.30 0 0 5 5 4 classi 10 x 20 classi 10 x 0.20 15 15 20 20 densità 0.00 0.05 0.10 0.15 densità 0.20 0.25 0.30 0.00 0.05 0.10 0.15 dall’istogramma alla densità normale densità 0 0 5 5 10 classi 10 x 20 classi 10 x 15 15 20 20 LEZIONE 2.6 – p. 6/15 variabile aleatoria normale • diciamo che una variabile aleatoria continua X a valori sulla retta reale (−∞, +∞) si distribuisce come una normale di parametri µ e σ 2 , e scriviamo X ∼ N (µ, σ 2 ) se, comunque preso un intervallo della retta (a, b) la probabilitaà di osservare l’evento (a < X < b) è data da P (a < X < b) = Z b f (x; µ, σ 2 )dx a dove 2 f (x; µ, σ ) = √ 1 2πσ 2 e − 2σ12 (x−µ)2 è una funzione di densità normale di parametri µ e σ 2 LEZIONE 2.6 – p. 7/15 la densità normale 0.15 0.10 0.05 densità di probabilità 0.20 N(µ, σ2) µ−σ • • µ µ+σ la densità normale di parametri µ e σ 2 è una curva di forma campanulare con ◦ punto di massimo assoluto in x = µ ◦ punti di flesso in x = µ ± σ se X ∼ N (µ, σ 2 ) allora il valore atteso e la varianza di X sono rispettivamenti dati da µ e σ 2 LEZIONE 2.6 – p. 8/15 al variare della varianza densità di probabilità la densità normale densità di probabilità 0.8 0.6 0.8 0.0 0.2 0.4 0.6 0.4 0.2 0.0 al variare della media LEZIONE 2.6 – p. 9/15 la normale standardizzata • ponendo µ = 0 e σ 2 = 1 si ottiene la densità normale standardizzata N (0, 1): 1 − z2 f (z) = √ e 2 2π la funzione di ripartizione della normale standardizzata è data da Z z 1 2 1 √ e− 2 z dz Φ(z) = P (Z < z) = 2π −∞ Φ(z) 0.0 0.2 0.1 0.4 0.2 0.6 0.3 0.8 1.0 0.4 N(0,1) 0.0 • 0 z 0 z LEZIONE 2.6 – p. 10/15 probabilità sotto N(0,1) • le tavole della normale contengono i valori di Φ(z) per z > 0 • per la simmetria della normale N (0, 1) si ha che: Φ(−z) = 1 − Φ(z) N(0,1) 0.4 0.3 0.2 0.1 0.0 0.0 0.1 0.2 0.3 0.4 N(0,1) 0 z −z 0 • quindi le tavole della normale consentono di conoscere i valori di Φ(z) per qualunque valore di z • se Z ∼ N (0, 1), allora P (a < Z < b) = P (Z < b) − P (Z < a) = Φ(b) − Φ(a) LEZIONE 2.6 – p. 11/15 uso della normale standardizzata • teorema: se X ∼ N (µ, σ 2 ) allora la variabile Z ottenuta standardizzando la variabile aleatoria X X−µ ∼ N (0, 1) Z= σ si distribuisce secondo una normale standardizzata • possiamo utilizzare questo risultato per trasformare le aree sotto una qualunque normale in aree equivalenti sotto la normale standardizzata: X ∼N (µ, σ 2 ) Z ∼N (0, 1) a−µ X −µ b−µ a−µ b−µ < < ) = P( <Z< ) P (a < X < b) =P ( σ σ σ σ σ b−µ a−µ =Φ −Φ σ σ LEZIONE 2.6 – p. 12/15 esempio • supponiamo che X ∼ N (10, 4) • la probabilità 8 − 10 12 − 10 <Z< ) = P (−1 < Z < 1) 2 2 =Φ(1) − Φ(−1) = Φ(1) − (1 − Φ(1)) = 2Φ(1) − 1 = 2 × 0.8413 − 1 = 0.6826 0.4 P (8 < X < 12) =P ( 0.1 0.2 0.3 N(0,1) 0.0 N(0,1) −6 −4 −2 0 2 4 6 8 10 12 14 LEZIONE 2.6 – p. 13/15 approssimazione della binomiale • supponiamo che X ∼ Bin(n, p) allora, quando n è molto alto, Bin(n, p) quindi Z b+0.5 a−0.5 1 p e 2πnp(1 − p) 1 −2 √ u−np np(1−p) du 0.00 0.02 0.04 0.06 0.08 0.10 0.12 0.14 P (a < X < b) ≈ densità • ≈ N (np, np(1 − p)) 5 10 15 20 xxx LEZIONE 2.6 – p. 14/15 esempio • si estraggono con ripetizione n = 100 palline da un un’urna contenente per il 30% palline blu • qual’è la probabilità di ottenere tra 30 e 40 palline blu? • X ∼ Bin(100, 0.3) • U ∼ N (100 × 0.3, 100 × 0.3 × 0.7) 40 X 100 k 100−k 0.3 0.7 P (30 ≤ X ≤ 40) = k k=30 Z 40.5 1 √u−100×0.3 1 −2 100×0.3×0.7 du √ e ≈ 2π100 × 0.3 × 0.7 29.5 40.5 − 100 × 0.3 29.5 − 100 × 0.3 <Z< √ ≈ P (29.5 < U < 40.5) = P √ 100 × 0.3 × 0.7 100 × 0.3 × 0.7 ≈ 0.532 LEZIONE 2.6 – p. 15/15