17/04/2016 Variabili casuali • Una variabile casuale X e’ una funzione definita sullo spazio campionario W che associa ad ogni evento E W un unico numero reale. X W E6 E1 E5 E9 E8 E7 • La funzione di probabilità deve verificare le due proprietà: P X i 0, i P X 1 x5 E4 • Una variabile casuale discreta X è caratterizzata dalla sua funzione di probabilità che associa ad ognuno dei valori xi la corrispondente probabilità P(X=xi). x6 E3 E2 Variabili casuali discrete i i • Una variabile aleatoria discreta può anche caratterizzarsi attraverso la sua funzione di ripartizione che fa corrispondere ai valori x le probabilità cumulate P(Xx): x4 F x P X x P X w x3 x2 w x x1 • Esempi: somma dei punteggi nel lancio di due dadi, numero di pezzi difettosi in un lotto, variazione giornaliera nel rendimento di un titolo, numero di prodotti di un certo tipo venduti 1 giornalmente in un particolare punto vendita • Una variabile casuale può essere classificata come discreta o continua. • Una variabile casuale discreta può assumere un insieme discreto (finito o numerabile) di numeri reali. • La funzione di ripartizione verifica le seguenti proprietà: F(x) è non decrescente F x 0 e lim F x 1 xlim x 3 F(x) è continua a destra Esempio • Corrispondenza tra eventi e valori della variabile casuale X={somma dei punteggi}, nella prova “lancio di due dadi” • Una variabile casuale continua può assumere tutti i valori compresi in un intervallo reale. W discreto V.C. discreta W continuo V.C. discreta o continua X 2 2 3 4 5 6 7 8 9 10 11 12 P(x) 136 2 36 3 36 4 36 5 36 6 36 5 36 4 36 3 36 2 36 136 F(x) 136 3 36 6 36 10 36 15 36 2136 2636 30 36 33 36 3536 1 4 17/04/2016 Esempio • Rappresentazione grafica della funzione di ripartizione per l’esempio del lancio di due dadi • Si consideri la v.a. X che può assumere tutti i valori dell’intervallo reale [a ; b] in modo che tutti i sottointervalli di uguale ampiezza abbiano la stessa probabilità. 1 0,8 0,6 • La funzione di ripartizione è 0,4 Funzione di densità di probabilità 0,2 0 1 se x a; b f x b a 0 altrimenti • La funzione di densità è F(x) 1 2 3 4 5 6 7 8 9 10 11 12 13 0 se x a x a F x se x a; b b a 1 se x b Funzione di ripartizione x 5 7 Variabili casuali continue • Una variabile casuale continua X è caratterizzata dalla sua funzione di densità, f(x) tale che l’area sottesa alla funzione, in un intervallo, è pari alla probabilità che X assuma un valore in quell’intervallo: Pa X b f x dx b • La funzione di densità deve verificare le proprietà: f x 0 a La probabilità che la v.c. assuma un particolare valore è 0. • Una v.a. continua può anche caratterizzarsi attraverso la funzione di F x P X x x • Il valore atteso di una v.c. X, è definito come f x dx 1 ripartizione: Valore atteso di una v.a. f w dw • La funzione di ripartizione verifica le proprietà già viste in precedenza; inoltre per v.a. continue, essa è assolutamente continua. 6 E X x i P xi EX i xf x dx se la v.c. è discreta se la v.c. è continua • Il valore atteso di una funzione Y = g(x), della v.a. X, può essere calcolato come: E Y g xi P xi se la v.c. è discreta E Y g x f x dx i se la v.c. è continua 8 17/04/2016 Varianza di una v.a. Esempio v.a. discreta • La varianza di una v.c. X, è definita come V X E X E X • X={somma dei punteggi}, nella prova “lancio di due dadi” Esempio v.a. continua a se la v.c. è discreta 2 i x E X f x dx se la v.c. è continua 2 • La varianza può essere, in modo equivalente, definita come: V X E X 2 E X 2 • Si definisce deviazione standard di X, la radice quadrata della sua varianza 11 SD X V X Media e Varianza di una combinazione lineare • Si consideri la v.a. X definita nell’intervallo [a ; b] vista prima • Sia Y una combinazione lineare di una v.c. X, ossia Y = a+bX, dove a e b sono delle costanti. Si possono allora dimostrare le seguenti proprietà: E Y E a bX a bE X x x2 b2 a 2 a b dx f x ba 2b a a 2b a 2 a b V X xi E X P xi V X 1 2 3 4 5 6 5 4 EX 2 3 4 5 6 7 8 9 36 36 36 36 36 36 36 36 3 2 1 10 11 12 7 36 36 36 9 b • A seconda del tipo di v.a., la precedente definizione diventa 2 3 4 5 6 7 8 9 10 11 12 X P(x) 136 2 36 3 36 4 36 5 36 6 36 5 36 4 36 3 36 2 36 136 F(x) 136 3 36 6 36 10 36 15 36 2136 2636 30 36 33 36 3536 1 E X xf x dx 2 b V Y V a bX b 2V X • Ponendo a = -E(X) e b = 1/SD(X), si ottiene una variabile aleatoria Y standardizzata, ossia, con valore atteso 0 e deviazione standard 1. E Y 0 10 V Y 1 Y X EX SD X 12 17/04/2016 Modelli di v.a. discrete: v.a. di Bernoulli Teorema di Chebyshev • Una v.a. Bernoulliana, indicata come X Bernoulli(p) assume solo due valori, 1 o 0, rispettivamente con probabilità p e 1-p. • Sia X una variabile casuale e k un valore reale positivo, allora vale la seguente disuguaglianza: • La funzione di probabilità di una v.a. di Bernoulli è: 1 P X E X k SD X 2 k P X x p x 1 p 1 x EX p 15 Modelli di v.a. discrete: v.a. uniforme Modelli di v.a. discrete: v.a. Binomiale • Una v.a. uniforme discreta X assume valori interi compresi in un certo intervallo [a,a+s-1], ciascuno con la stessa probabilità. Viene indicata come X UD(a,s). • La funzione di probabilità di una uniforme discreta è: 1 se x a; a s 1 P x s 0 altrimenti • Media e varianza di una uniforme discreta sono rispettivamente: s 1 s2 1 EX a e V X 2 12 0,14 E X 4,5 V X 5,25 SD X 2,29 0,12 0,10 0,06 0,04 0,00 1 2 3 4 5 6 7 14 • La v.a. Binomiale è una distribuzione discreta che si utilizza quando si è in presenza di n prove indipendenti (es. n estrazioni con ripetizione o n estrazioni da una popolazione infinita), ciascuna prova ha solo due esiti possibili, indicati come successo e insuccesso (es. difettoso/non difettoso, aumento/decremento, acquisto/mancato acquisto), e la probabilità p (es. tasso di difettosità) di osservare un successo in una singola prova rimane costante per tutte le prove. • Una v.a. Binomiale si indica come X Binomiale(p;n) e la sua funzione di probabilità è: n n x P X x p x 1 p x 0,08 0,02 e V X p 1 p • Tutte le prove che producono solo due possibili risultati generano v.c. di Bernoulli: il lancio di una moneta, il superamento o meno di un certo livello di inflazione, l’aumento o meno della quotazione di un titolo, l’acquisto o meno di un certo prodotto, la difettosità o l’integrità di un certo pezzo… 13 • Esempio: X UD(1,8) x 0, 1 • Media e varianza di una Bernoulliana sono rispettivamente: Indipendentemente dalla distribuzione della v.c., la probabilità che X assuma valori distanti dalla media più di k deviazioni standard è al più 1/k2 P(x) per 8 x per x 0, 1, , n e 0 p 1 16 17/04/2016 Esempio • Una v.a. Binomiale può essere ottenuta considerando la somma di v.c. di Bernoulli, indipendenti e identicamente distribuite: X X1 X 2 X n X i n i 1 dove Xi Bernoulli(p), indipendentemente per ogni i. • Media e varianza di una Binomiale sono rispettivamente: E X np e V X np 1 p • Una v.a. Binomiale è caratterizzata dalle seguenti proprietà: Il valore atteso e la varianza crescono al crescere di n; Per p=0,5 la distribuzione è simmetrica rispetto al valor medio (n/2); Per n→ la distribuzione tende ad essere simmetrica rispetto al valor medio. 0,250 • Le informazioni a disposizione sono: p = 0,05; n = 20; Binomiale(20;0,5) • Vogliamo calcolare P(X = 0), P(X = 1) 0,150 e infine P(X = 2). n! 20! n0 200 p0 1 p 0,050 1 0,05 0,3585 0! n 0! 0! 20 0 ! n! 20! n1 201 P( X 1) p1 1 p 0,051 1 0,05 0,3774 1! n 1 ! 1! 20 1 ! P( X 0) 0,100 0,050 0,000 19 • Indichiamo con: p la probabilità di produrre un tappo difettoso; n il numero di tappi estratti; X il numero di tappi difettosi tra quelli estratti. Binomiale(7;0,5) 0,200 È più probabile che si trovi ad osservare 1 solo tappo difettoso o nessun tappo difettoso? E qual è invece la probabilità di osservarne 2? 17 Esempi di Binomiale 0,300 • Un’industria che produce tappi di sughero sa che il tasso di difettosità dei macchinari a disposizione è del 5%. Per controllare giornalmente che tale tasso rimanga invariato, il responsabile del controllo di qualità ogni giorno estrae 20 tappi a caso tra quelli prodotti e osserva quanti di essi risultano difettosi. 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 18 P( X 2) n! 20! n2 202 p2 1 p 0,052 1 0,05 0,1887 20 2! n 2! 2! 20 2! 17/04/2016 Distrib u zion e d i p rob ab ilità d ella variab ile "n ° d i tap p i d ifettosi osservati" 0.4 0.35 0.3 P(X) 0.25 0.2 0.15 0.1 0.05 0 0 5 X 10 15 20 21 • In generale, una v.a. discreta che rappresenta il numero di volte che si realizza un certo evento aleatorio in un dato intervallo (di tempo o di spazio) può essere approssimata bene da una Poisson se, suddividendo l’intervallo in tanti sottointervalli, valgono le seguenti condizioni La probabilità di osservare esattamente un evento nel sottointervallo è costante La probabilità di osservare più di un evento nel sottointervallo è pari a zero Il verificarsi di un evento in un sottointervallo è indipendente dal verificarsi di un evento in un altro sottointervallo • Una v.a. di Poisson è caratterizzata dalle seguenti proprietà: Se Xi Poisson(li) indipendentemente per ogni i = 1,…,n, allora X Poisson(l1+l2+…+ln), dove X = X1+X2+…+Xn. La v.a. Binomiale al crescere di n e per p piccolo, tende ad una v.a. di Poisson con parametro l = np. 23 Modelli di v.a. discrete: v.a. di Poisson • Una v.a. di Poisson, indicata come X Poisson(l) può assumere qualsiasi valore intero x ≥ 0. • La funzione di probabilità di una v.a. di Poisson è: e l lx P X x x 0, 1, 2, 0 l x! • Media e varianza di una Poisson sono rispettivamente: EX l e V X l • La distribuzione di Poisson è adeguata per approssimare v.a. che rappresentano conteggi: il numero di persone che arrivano ad uno sportello in un certo intervallo di tempo, il numero di errori di battitura in una pagina, il numero di incidenti in un tratto stradale, il numero di rimborsi chiesti in un giorno ad una compagnia assicurativa… 22 Esempi di v.a. di Poisson 0,40 Poisson(1) 0,35 0,30 Poisson(3) 0,25 0,20 Poisson(7) 0,15 0,10 0,05 0,00 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 24 17/04/2016 Modelli di v.a. continue: v.a. uniforme • Una v.a. Uniforme continua X, indicata come X U(a;b), può assumere valori sull’ intervallo reale limitato [a;b], in modo che tutti i sottointervalli di uguale ampiezza abbiano la stessa probabilità. • La funzione di densità è 1 se x a; b f x b a 0 altrimenti Esempi di v.a. Normali s 0,75 0,60 N(0;1) 0,45 0,30 • Media e varianza di una uniforme sono rispettivamente: ab a b 2 EX e V X 2 12 s s 0,15 0,00 -4,5 s -3,0 -1,5 0,0 1,5 1,5 • Esempio: X U(0;1), 4,5 m=0 m=1 m=2 m=3 m=4 m=5 0,30 f x 1,0 0,15 0,25 0,5 0,2 0,0 -0,50 -0,25 0,00 0,25 0,50 0,75 1,00 1,25 25 0,00 1,50 Modelli di v.a. continue: v.a. Normale • Una v.a. Normale (o Gaussiana) X, indicata come X N(m;s2), può assumere valori su tutto l’asse reale. • La funzione di densità è 1 x m 2 1 m s 2 0 f x exp 2 2 s s 2p Ogni trasformazione lineare di una v.a. Normale è ancora una v.a. Normale La somma di v.c. Normali indipendenti è ancora una v.c. Normale con media e varianza pari, rispettivamente, alla somma delle medie e delle varianze delle v.c. Normali. 26 0,0 1,5 3,0 4,5 6,0 27 7,5 • La funzione di densità della Normale standard è f z e V X s 2 • La Normale gode delle seguenti proprietà: -1,5 • Se la v.a. X ha una distribuzione normale con parametri m e s2, allora Z = (X- m)/s è ancora una v.a. Normale con media 0 e varianza 1. La v.a. Z è nota come Normale standardizzata e si indica come Z N(;1). • Media e varianza di una normale sono rispettivamente: EX m 0,45 3,0 1 2p 1 exp z 2 2 0,30 0,15 0,00 0,95 -1,96 0,00 1,96 28 17/04/2016 ESEMPIO • La funzione di ripartizione di una v.a. Normale standard viene in genere indicata come (•), ossia Un’industria che produce componenti sta valutando la possibilità di fornire una grossa ditta. I macchinari sono settati per produrre componenti con un diametro di 10mm, tuttavia non tutti i pezzi prodotti hanno esattamente la stessa dimensione. È noto invece che il diametro dei pezzi prodotti segue una distribuzione normale con media 10mm e deviazione standard 0,5mm. La ditta che dovrebbe acquistare questi pezzi può utilizzare esclusivamente componenti con un diametro compreso tra 9 e 11 mm. F z P( Z z ) z • I valori della funzione di ripartizione di una Normale standard sono tabulati e questo semplifica i calcoli delle aree sottese dalla funzione di densità. • Esempio: Calcolo dell’area sottesa nell’intervallo [-2,2] 2 2 2 1 2 22 1 2 0,977 1 0,954 Si vuole stabilire se almeno il 90% della produzione di componenti incontri le necessità della ditta. 29 31 Densità della variabile "diametro" 0.8 0.7 0.7 0.6 0.6 0.5 0.5 0.4 0.4 0.3 0.3 0.2 0.2 0.1 0.1 0 5 6 7 8 9 10 11 Densità standardizzata 0.8 12 13 14 15 0 -5 -4 -3 -2 -1 0 1 2 3 4 5 Indichiamo con X la variabile “diametro”: 9 m X m 11 m P 9 X 11 P s s s 30 11 10 9 10 P Z P 2 Z 2 0,9545 0,5 0,5 32 17/04/2016 ESEMPIO Un punto vendita di una catena di fast food ha cominciato ad offrire un servizio di consegna pasti a domicilio. Per battere la concorrenza il proprietario ha deciso di offrire il pasto gratis ai clienti che ricevono la consegna con un ritardo eccessivo. Dato l’attuale margine di profitto, il proprietario conclude che è possibile offrire un numero di pasti gratis pari al 2,5% delle ordinazioni. Sapendo che il tempo di consegna si distribuisce approssimativamente in maniera normale con media pari a 20 min. e deviazione standard pari a 5 min., il proprietario vuole determinare un livello soglia per il tempo d’attesa, oltre il quale fornire il pasto gratis, in modo tale che il numero di pasti gratis offerti non superi il 2,5% delle ordinazioni. 33 Perché la distribuzione normale è così importante? Banconota da 10 Marchi con l’immagine di Carl Friedrich Gauss e la funzione di densità normale. Molti fenomeni tendono naturalmente ad avere una distribuzione campanulare ben approssimabile con una distribuzione normale. Ossia è un modello teorico che si adatta bene a molti dati empirici. È facilmente trattabile da un punto di vista matematico. In molte applicazioni, conclusioni basate sull’assunzione di normalità dei dati non sono seriamente affette da scostamenti dalla normalità contenuti. Ma soprattutto Deve la sua importanza all’esistenza del teorema del limite centrale. 35 Il teorema del limite centrale 0.1 Densità della variabile "tempo di consegna" 0.4 0.09 Siano X1,…, Xn, n variabili casuali indipendenti e identicamente distribuite (i.i.d.) con media E(Xi) = m e varianza V(Xi) = σ2 entrambe finite. Sia Sn = X1+…+Xn, la loro somma avente media E(Sn) = nm e varianza V(Sn) = nσ2. Allora per n → ∞, Sn tende a distribuirsi normalmente. 0.35 0.08 0.3 0.07 0.25 0.06 Un enunciato equivalente del teorema stabilisce che, posto 0.2 0.05 0.04 0.15 0,025 0.03 0.02 Xn 0,025 0.1 0.05 0.01 0 0 Densità standardizzata 5 10 15 20 25 x=? 35 40 0 -5 -3 -1 0 1 1,96 3 5 Indichiamo con X la variabile “tempo di attesa” e con x la soglia da determinare: xm X m xm 0,025 P X x P P Z s s s Dalle tavole della distribuzione normale otteniamo: 0, 025 P Z 1,96 Quindi xm s 1,96 e x 1,96s m 1,96 5 20 29,8 34 1 n Xi n i 1 e restando valide le condizioni enunciate sopra, si ha che la variabile Zn X n m n s converge, per n → ∞, ad una Normale standard. ESEMPIO Siano X1,…, Xn, n variabili bernoulliane indipendenti con identica probabilità di successo p (quindi E(X1) = p e V(X1) = p(1-p)). Abbiamo visto che la loro somma Sn = X1+…+Xn si distribuisce come una variabile binomiale con media E(Sn) = np e varianza V(Sn) = np(1-p). In virtù del teorema del limite 36 centrale, per n → ∞, Sn tende a distribuirsi normalmente. 17/04/2016 Esempi di v.a. Chi-quadrato Applicazioni del teorema c 2 4 0,15 c 2 8 0,10 c 2 12 c 2 20 0,05 0,00 0,0 7,5 15,0 22,5 30,0 All’aumentare di g la distribuzione tende ad una N(g;2g) 39 37 Modelli di v.a. continue: Chi-quadrato • Una v.a. Chi-quadrato X, indicata come X c(g), può assumere valori nell’intervallo [0;]. • La funzione di densità è f x 1 g 2 2 g 2 g 1 x2 e x 2 • Una v.a. t di Student T, indicata come T Student(g), può assumere valori nell’intervallo [- ;]. per x 0 • Media e varianza di una Chi-quadrato sono rispettivamente: EX g e V X 2g • Una v.a. c(g) si può ottenere come somma dei quadrati di g v.a. Normali standardizzate indipendenti, ossia c g Z Z Z 2 2 1 2 2 Modelli di v.a. continue: t di Student 2 g 38 • Una v.a. T Student(g) si può ottenere come rapporto tra una v.a. Normale standardizzata e la radice quadrata di una v.a. Chi-quadrato divisa per i suoi gradi di libertà, ossia T Z Y g dove Z N(0,1) e Y c(g). 40 17/04/2016 Dove e come studiare Cenni sulle v.a. doppie • Una variabile aleatoria doppia (X,Y) è una funzione definita sullo spazio campionario W, che associa a ogni risultato i una coppia di numeri reali (x,y). • Una v.a. doppia è completamente definita dalla sua funzione di probabilità congiunta o dalla sua funzione di densità congiunta, a seconda che sia discreta o continua. • Libro di testo: S. Borra, A. Di Ciaccio (2014), Cap. 9 (escluso paragrafo 9.8.5) • Svolgere ‘Esercitazione 5’. • Svolgere i restanti esercizi nel file ‘Esercizi di probabilità.xls’. • In caso di indipendenza si deve avere: Caso discreto Caso continuo P x, y P x P y f x, y f x f y 41 Media e varianza di combinazioni lineari di v.a. • Il valore atteso di una combinazione lineare di p v.a. è dato da X a1 X 1 a 2 X 2 a p X p E X a1 E X 1 a 2 E X 2 a p E X p mentre la varianza è V X aiV X i 2 a i a j Cov X i , X j p dove i 1 p p i 1 j i 1 Cov X i , X j s X i , X j E X i E X i X j E X j è la covarianza tra Xi e Xj. 42 43