Variabili casuali continue
Se siamo interessati alla temperatura massima giornaliera questa
è una variabile casuale misurata in un intervallo continuo e quindi
è una v.c. continua
una variabile casuale è continua se può assumere un qualunque
valore in un intervallo
Se la var. casuale è continua non è possibile elencare tutte le
singole realizzazioni (cioè tutti i valori) perché questi sono una
infinità più che numerabile e quindi non si può attribuire una
probabilità ai singoli valori
ESEMPIO: la probabilità che oggi al temperatura max sia esattamente 5,21° è 0
Si può però determinare la probabilità per intervalli di valori:
la probabilità che oggi la temperatura massima sarà tra i 5° e i 6°
Dal discreto al continuo (1)
Un campione di schede logiche di un elettrodomestico è stato raggruppate in classi
annuali di durata:
30
Durata Schede h
80
0 4
50.0
240
4 12
30.0
35
12 14
17.5
60
14 20
10.0
415
25
20
15
10
Suddividiamo ora le classi in
sottoclassi di ampiezza unitaria:
Durata
0 1
1 2
2 3
3 4
4 5
5 6
6 7
7 8
8 9
9 10
Schede
10
15
25
30
32
34
47
43
40
38
Durata Schede
10 11
35
11 12
27
12 13
22
13 14
18
14 15
15
15 16
14
16 17
13
17 18
10
18 19
8
19 20
4
415
L’istogramma sarà formato da rettangoli
di base uno e altezza pari alla fr. relativa
5
0
0
50
45
40
35
30
25
20
15
10
5
0
2
0
4
2
6
4
6
8
10
12
14 16
8
10
12
14
16
18
18
20
20
Dal discreto al continuo (2)
Supponiamo ora di estendere la rilevazione all’infinito, ma con classi pari ad
un infinitesimo dx:
[x, x+dx]
ovvero l’intorno più piccolo diverso dal punto singolo
L’istogramma non è più tracciabile e diventa simile al poligono di frequenza
f(x)
Per tale motivo nel caso var. casuali
continue non si può più parlare di
funzione di probabilità…
x
Densità di probabilità
Chiameremo funzione di densità la funzione matematica f(x)
per cui l’area sottesa alla funzione, corrispondente ad un certo
intervallo, è uguale alla probabilità che X assuma un valore in
quell’intervallo
fx
0,7
2,0
∫ f (x)dx = 0, 229
1,5
0,5
1,0
0,5
P(0,5<X<0,7)
0,229
0,0
0,0
0,5
0,7
1,0
La f. di densità di una V.C. continua X è una
funzione definita su R per ogni valore della X
X
Proprietà della densità di probabilità
1. La f(x) è sempre non negativa
2. L’area totale sottesa alla funzione è pari a 1:
+∞
∫ f ( x ) dx
= 1
−∞
3. La probabilità che la v.c. assuma un particolare valore
dell’intervallo è zero
N.B. La f(X) non dà la probabilità di X, ma è proporzionale alla
prob. che X ricada in un intervallo infinitesimale centrato su X
Alcune considerazioni
La funzione di densità per le v.c. continue gioca (nel continuo) lo
stesso ruolo della distribuzione di probabilità per le v.c. discrete
Consideriamo una stazione di servizio con una cisterna per la benzina
da 1000 litri, riempita ogni mattina prima dell’apertura. L’analisi
delle vendite passate indica che non è possibile prevedere la quantità
totale di benzina venduta in un dato giorno, ma il limite inferiore
sarà 0 e il limite superiore 1000 litri: la capacità della cisterna. Inoltre
l’analisi storica indica che tutte le richieste nell’intervallo da 0 a 1000
litri, sono egualmente probabili
X = litri di benzina venduti in un dato giorno
Potremmo essere interessati a conoscere le probabilità di diversi livelli
di vendite giornaliere, tenendo conto che le quantità vendute, tra 0 e
1000 litri, hanno tutte la stessa probabilità
La distribuzione di probabilità di X è uniforme in 0-1000: si ha cioè la stessa
probabilità per ogni intervallo di vendite da 0 a 1000
In altri termini la funzione di densità di probabilità è costante nell’intervallo
0 - 1000 e può essere scritta come:
0.001
f (x ) = 
 0
se 0 ≤ x ≤ 1000
altrove
f x
Es. la probabilità che le vendite siano tra
250 e 750 litri, con f(x)=0.001 ordinata
della funzione di densità costante, è pari
a 0.50, cioè l’area sottesa sull’intervallo
tra 250 e 750
0.001,
0,50
0,0
0,00
250
500
750
1000
Funzione di ripartizione nel continuo (1)
La definizione di funzione di ripartizione per le v.c. continue è simile
al caso discreto
Data una v.c. continua X, la funzione che fa corrispondere ai valori x le
probabilità cumulate P(X≤
≤ x) viene detta funzione di ripartizione.
F( x ) = P( X ≤ x ) =
x
∫ f ( w )dw
−∞
La FdR può essere usata per calcolare la probabilità di un intervallo:
se a e b sono due possibili valori di X con a<b, la probabilità che X
assuma valori tra a e b è pari a
P(a<X<b) = F(b) - F(a)
Funzione di ripartizione nel continuo (2)
Nell’esempio considerato la F.d.R. è data da:
F ( x ) = 0.001x per 0 ≤ x ≤ 1000
Dalla figura si vede che la probabilità
di vendere tra 0 e 400 litri è:
P(X≤400) = (0.001)(400) = 0.40
La probabilità di vendere tra 250 e
700 litri è:
P(a<X<b) = P(250<X<750) =
0.001b - 0.001a = 0.001(b-a)
= 0.001(750-250) = 0.50
Esempio
Una squadra di manutenzione è responsabile di un tratto di un oleodotto
lungo 2 km. La v.c. distanza (in km) alla quale può verificarsi un guasto è
rappresentata da:

0.5


f ( x) =



0
se 0 ≤ x ≤ 2
altrove
Trovare la FdR e la probabilità che il guasto si verifichi tra il Km 0.5 e 1.5
f(x)
F(x0) = 0.5x0 per 0≤x0≤2
P(0.5<X<1.5) = F(1.5) - F(0.5) =
= (0.5)(1.5) - (0.5)(0.5) = 0.5
coincide con l’area sottesa
alla f.di densità in [0.5,1.5]
0.5
0
2
x
VALORE ATTESO DI UNA VARIABILE CASUALE
Anche per le variabili casuali è utile disporre di misure che sintetizzino
le caratteristiche della distribuzione
il valore atteso è la corrispondente misura della media (per dati reali)
per una v.c. X, ed è definito come:
Se la v.c. è discreta:
E ( X ) = µ = ∑ xi P( xi )
i
Se la v.c. è continua:
E(X ) = µ =
+∞
∫ x f (x ) dx
−∞
(essendo 0 la per una v.c. continua la probabilità associata ad
ogni singolo valore in un intervallo)
Esempio
Dall’esame di diversi libri di testo di argomento economico-aziendale è stato
rilevato che l’81% di tutte le pagine era privo di errori; il 17% ne conteneva
1 e il 2% ne conteneva 2. Usando la v.c. X per indicare il n° di errori in una
pagina scelta a caso da uno di questi libri, la distribuzione di probabilità è:
P(0)=0.81
P(1)=0.17
P(2)=0.02
Nel determinare la media di X (n° medio di errori per pag. che ci aspettiamo
di trovare) i diversi risultati debbono essere pesati tramite le probabilità del
loro verificarsi:
(0)(0.81)+(1)(0.17)+(2)(0.02) =
∑ x P(x ) = E( X ) = µ = 0.21
i
i
i
Altro Esempio: v.c. discreta
2
x
P(x)
1
36
3
2
36
4
3
5
36
4
6
5
36
7
6
36
36
8
5
36
9
4
36
10 11 12
3
36
2
36
1
36
1
2
3
4
5
6
5
4
E(X ) = 2 + 3 + 4 + 5 + 6 + 7 + 8 + 9
36
36
36
36
36
36
36
36
3
2
1
+ 10
+ 11 + 12
=7
36
36
36
P(X)
0,168
0,14
0,112
0,084
0,056
0,028
0
2
3
4
5
6
7
X
8
9
10
11
12
Nelle distribuzioni di prob.
simmetriche il valore atteso
si trova esattamente al centro
della distribuzione
Esempio: v.c. continua
Consideriamo la v.c.
X ~ λe
− λx
x≥0
2,0
con λ costante positiva
1,6
Il valore atteso è dato da
1,2
0,8
E(X ) =
+∞
∫ xλ e
−∞
− λx
1
dx =
λ
0,4
0,0
0,0
0,5
1,0
1,5
2,0
2,5
3,0
Ad esempio: tempo medio di attesa prima che venga sbrigata
una certa pratica in un ufficio pubblico
Varianza di una variabile casuale
La varianza V(X) di una variabile casuale X è definita da
V ( X ) = ∑  xi − E ( X )  P ( xi )
2
Se la v.c. è discreta
i
V (X) =
Se la v.c. è continua
+∞
∫  x − E ( X ) f ( x ) dx
2
−∞
Notazione alternativa:
{
V ( X ) = E  X − E ( X ) 
2
}
V ( X ) = E( X
2
) − E ( X )
2
Esempio
Riprendiamo l’esempio delle automobili: basandosi sulle vendite degli
anni precedenti il direttore di una concessionaria sa che ogni giorno, il
n° di auto vendute per una certa categoria varia tra 0 e 5
0,3
X
0
1
2
3
4
5
0,2
P(X) 0,15 0,30 0,20 0,20 0,10 0,05
0,1
0
Calcoliamo il valore atteso e la varianza
0
1
2
3
4
5
E ( X ) = µ = ∑ xi P ( xi ) = 0 ⋅ 0,15 + 1 ⋅ 0,30 + L + 5 ⋅ 0,05 = 1,95
i
V ( X ) = σ 2 = ∑ (xi − µ )2 P ( xi ) = ∑ x 2i P ( xi ) − µ 2 =
i
i
(0 − 1,95)2 ⋅ 0,15 + (1 − 1,95)2 ⋅ 0,3 + L + (5 − 1,95)2 ⋅ 0,05 = 1,9475
Teorema di Chebyshev
Sia X una variabile casuale e k un valore reale positivo, allora vale la
seguente disuguaglianza:
1
P E(X)−k⋅SD(X) ≤ X ≤ E(X) +k⋅SD(X) ≥1− 2
k
Indipendentemente dalla distribuzione della var. casuale, la probabilità
che X assuma valori distanti dalla media più di k deviazioni standard è
al più 1/k2
P ( X − E ( X ) ≥ k ⋅ SD( X )) ≤ 2
k
1