Variabili casuali continue Se siamo interessati alla temperatura massima giornaliera questa è una variabile casuale misurata in un intervallo continuo e quindi è una v.c. continua una variabile casuale è continua se può assumere un qualunque valore in un intervallo Se la var. casuale è continua non è possibile elencare tutte le singole realizzazioni (cioè tutti i valori) perché questi sono una infinità più che numerabile e quindi non si può attribuire una probabilità ai singoli valori ESEMPIO: la probabilità che oggi al temperatura max sia esattamente 5,21° è 0 Si può però determinare la probabilità per intervalli di valori: la probabilità che oggi la temperatura massima sarà tra i 5° e i 6° Dal discreto al continuo (1) Un campione di schede logiche di un elettrodomestico è stato raggruppate in classi annuali di durata: 30 Durata Schede h 80 0 4 50.0 240 4 12 30.0 35 12 14 17.5 60 14 20 10.0 415 25 20 15 10 Suddividiamo ora le classi in sottoclassi di ampiezza unitaria: Durata 0 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 9 9 10 Schede 10 15 25 30 32 34 47 43 40 38 Durata Schede 10 11 35 11 12 27 12 13 22 13 14 18 14 15 15 15 16 14 16 17 13 17 18 10 18 19 8 19 20 4 415 L’istogramma sarà formato da rettangoli di base uno e altezza pari alla fr. relativa 5 0 0 50 45 40 35 30 25 20 15 10 5 0 2 0 4 2 6 4 6 8 10 12 14 16 8 10 12 14 16 18 18 20 20 Dal discreto al continuo (2) Supponiamo ora di estendere la rilevazione all’infinito, ma con classi pari ad un infinitesimo dx: [x, x+dx] ovvero l’intorno più piccolo diverso dal punto singolo L’istogramma non è più tracciabile e diventa simile al poligono di frequenza f(x) Per tale motivo nel caso var. casuali continue non si può più parlare di funzione di probabilità… x Densità di probabilità Chiameremo funzione di densità la funzione matematica f(x) per cui l’area sottesa alla funzione, corrispondente ad un certo intervallo, è uguale alla probabilità che X assuma un valore in quell’intervallo fx 0,7 2,0 ∫ f (x)dx = 0, 229 1,5 0,5 1,0 0,5 P(0,5<X<0,7) 0,229 0,0 0,0 0,5 0,7 1,0 La f. di densità di una V.C. continua X è una funzione definita su R per ogni valore della X X Proprietà della densità di probabilità 1. La f(x) è sempre non negativa 2. L’area totale sottesa alla funzione è pari a 1: +∞ ∫ f ( x ) dx = 1 −∞ 3. La probabilità che la v.c. assuma un particolare valore dell’intervallo è zero N.B. La f(X) non dà la probabilità di X, ma è proporzionale alla prob. che X ricada in un intervallo infinitesimale centrato su X Alcune considerazioni La funzione di densità per le v.c. continue gioca (nel continuo) lo stesso ruolo della distribuzione di probabilità per le v.c. discrete Consideriamo una stazione di servizio con una cisterna per la benzina da 1000 litri, riempita ogni mattina prima dell’apertura. L’analisi delle vendite passate indica che non è possibile prevedere la quantità totale di benzina venduta in un dato giorno, ma il limite inferiore sarà 0 e il limite superiore 1000 litri: la capacità della cisterna. Inoltre l’analisi storica indica che tutte le richieste nell’intervallo da 0 a 1000 litri, sono egualmente probabili X = litri di benzina venduti in un dato giorno Potremmo essere interessati a conoscere le probabilità di diversi livelli di vendite giornaliere, tenendo conto che le quantità vendute, tra 0 e 1000 litri, hanno tutte la stessa probabilità La distribuzione di probabilità di X è uniforme in 0-1000: si ha cioè la stessa probabilità per ogni intervallo di vendite da 0 a 1000 In altri termini la funzione di densità di probabilità è costante nell’intervallo 0 - 1000 e può essere scritta come: 0.001 f (x ) = 0 se 0 ≤ x ≤ 1000 altrove f x Es. la probabilità che le vendite siano tra 250 e 750 litri, con f(x)=0.001 ordinata della funzione di densità costante, è pari a 0.50, cioè l’area sottesa sull’intervallo tra 250 e 750 0.001, 0,50 0,0 0,00 250 500 750 1000 Funzione di ripartizione nel continuo (1) La definizione di funzione di ripartizione per le v.c. continue è simile al caso discreto Data una v.c. continua X, la funzione che fa corrispondere ai valori x le probabilità cumulate P(X≤ ≤ x) viene detta funzione di ripartizione. F( x ) = P( X ≤ x ) = x ∫ f ( w )dw −∞ La FdR può essere usata per calcolare la probabilità di un intervallo: se a e b sono due possibili valori di X con a<b, la probabilità che X assuma valori tra a e b è pari a P(a<X<b) = F(b) - F(a) Funzione di ripartizione nel continuo (2) Nell’esempio considerato la F.d.R. è data da: F ( x ) = 0.001x per 0 ≤ x ≤ 1000 Dalla figura si vede che la probabilità di vendere tra 0 e 400 litri è: P(X≤400) = (0.001)(400) = 0.40 La probabilità di vendere tra 250 e 700 litri è: P(a<X<b) = P(250<X<750) = 0.001b - 0.001a = 0.001(b-a) = 0.001(750-250) = 0.50 Esempio Una squadra di manutenzione è responsabile di un tratto di un oleodotto lungo 2 km. La v.c. distanza (in km) alla quale può verificarsi un guasto è rappresentata da: 0.5 f ( x) = 0 se 0 ≤ x ≤ 2 altrove Trovare la FdR e la probabilità che il guasto si verifichi tra il Km 0.5 e 1.5 f(x) F(x0) = 0.5x0 per 0≤x0≤2 P(0.5<X<1.5) = F(1.5) - F(0.5) = = (0.5)(1.5) - (0.5)(0.5) = 0.5 coincide con l’area sottesa alla f.di densità in [0.5,1.5] 0.5 0 2 x VALORE ATTESO DI UNA VARIABILE CASUALE Anche per le variabili casuali è utile disporre di misure che sintetizzino le caratteristiche della distribuzione il valore atteso è la corrispondente misura della media (per dati reali) per una v.c. X, ed è definito come: Se la v.c. è discreta: E ( X ) = µ = ∑ xi P( xi ) i Se la v.c. è continua: E(X ) = µ = +∞ ∫ x f (x ) dx −∞ (essendo 0 la per una v.c. continua la probabilità associata ad ogni singolo valore in un intervallo) Esempio Dall’esame di diversi libri di testo di argomento economico-aziendale è stato rilevato che l’81% di tutte le pagine era privo di errori; il 17% ne conteneva 1 e il 2% ne conteneva 2. Usando la v.c. X per indicare il n° di errori in una pagina scelta a caso da uno di questi libri, la distribuzione di probabilità è: P(0)=0.81 P(1)=0.17 P(2)=0.02 Nel determinare la media di X (n° medio di errori per pag. che ci aspettiamo di trovare) i diversi risultati debbono essere pesati tramite le probabilità del loro verificarsi: (0)(0.81)+(1)(0.17)+(2)(0.02) = ∑ x P(x ) = E( X ) = µ = 0.21 i i i Altro Esempio: v.c. discreta 2 x P(x) 1 36 3 2 36 4 3 5 36 4 6 5 36 7 6 36 36 8 5 36 9 4 36 10 11 12 3 36 2 36 1 36 1 2 3 4 5 6 5 4 E(X ) = 2 + 3 + 4 + 5 + 6 + 7 + 8 + 9 36 36 36 36 36 36 36 36 3 2 1 + 10 + 11 + 12 =7 36 36 36 P(X) 0,168 0,14 0,112 0,084 0,056 0,028 0 2 3 4 5 6 7 X 8 9 10 11 12 Nelle distribuzioni di prob. simmetriche il valore atteso si trova esattamente al centro della distribuzione Esempio: v.c. continua Consideriamo la v.c. X ~ λe − λx x≥0 2,0 con λ costante positiva 1,6 Il valore atteso è dato da 1,2 0,8 E(X ) = +∞ ∫ xλ e −∞ − λx 1 dx = λ 0,4 0,0 0,0 0,5 1,0 1,5 2,0 2,5 3,0 Ad esempio: tempo medio di attesa prima che venga sbrigata una certa pratica in un ufficio pubblico Varianza di una variabile casuale La varianza V(X) di una variabile casuale X è definita da V ( X ) = ∑ xi − E ( X ) P ( xi ) 2 Se la v.c. è discreta i V (X) = Se la v.c. è continua +∞ ∫ x − E ( X ) f ( x ) dx 2 −∞ Notazione alternativa: { V ( X ) = E X − E ( X ) 2 } V ( X ) = E( X 2 ) − E ( X ) 2 Esempio Riprendiamo l’esempio delle automobili: basandosi sulle vendite degli anni precedenti il direttore di una concessionaria sa che ogni giorno, il n° di auto vendute per una certa categoria varia tra 0 e 5 0,3 X 0 1 2 3 4 5 0,2 P(X) 0,15 0,30 0,20 0,20 0,10 0,05 0,1 0 Calcoliamo il valore atteso e la varianza 0 1 2 3 4 5 E ( X ) = µ = ∑ xi P ( xi ) = 0 ⋅ 0,15 + 1 ⋅ 0,30 + L + 5 ⋅ 0,05 = 1,95 i V ( X ) = σ 2 = ∑ (xi − µ )2 P ( xi ) = ∑ x 2i P ( xi ) − µ 2 = i i (0 − 1,95)2 ⋅ 0,15 + (1 − 1,95)2 ⋅ 0,3 + L + (5 − 1,95)2 ⋅ 0,05 = 1,9475 Teorema di Chebyshev Sia X una variabile casuale e k un valore reale positivo, allora vale la seguente disuguaglianza: 1 P E(X)−k⋅SD(X) ≤ X ≤ E(X) +k⋅SD(X) ≥1− 2 k Indipendentemente dalla distribuzione della var. casuale, la probabilità che X assuma valori distanti dalla media più di k deviazioni standard è al più 1/k2 P ( X − E ( X ) ≥ k ⋅ SD( X )) ≤ 2 k 1