Principi di Statistica a.a. 2014-2015 Dr. Luca Secondi 02. Distribuzioni di probabilità per variabili casuali discrete 1 Variabili casuale di Bernoulli La v.c. di Bernoulli trae origine da una prova nella quale ha interesse esclusivamente verificare se un certo evento si è o meno verificato. La v.c. generata assume, convenzionalmente, valore 1 se l’evento si è verificato (successo) e valore 0 se invece l’evento non si è verificato (insuccesso). Tutte le prove che producono solo due possibili risultati generano v.c. di Bernoulli: il lancio di una moneta, il sesso di un nascituro, la sopravvivenza pari a 10 anni di un individuo affetto da una determinata patologia, il superamento di un esame universitario, la decisione di acquistare (o meno) un determinato farmaco V.c. di Bernoulli Evento A A Valore della v.c. 1 0 Probabilità π 1- π La sua funzione di probabilità può essere espressa come P ( X = x ) = π x (1 − π )1− x per x = 0,1 Valori sintetici E(X) = ∑ x ⋅ f (x) = 1 ⋅ π + 0 ⋅ (1 − π) = π x V(X) = ∑ (x − E(X)) 2 ⋅ f (x) = (1 − π) 2 ⋅ π + (0 − π) 2 ⋅ (1 − π) = x = π(1 − π) 3 Variabile casuale binomiale La v.c. Binomiale può essere ottenuta come la somma di v.c. di Bernoulli indipendenti e identicamente distribuite. Pertanto se per n volte si ripete nelle medesime condizioni lo schema successo-insuccesso si genera una sequenza di n sottoprove indipendenti a ciascuna delle quali si può associare una v.c. di Bernoulli. Lo schema binomiale può essere assimilato all’estrazione con ripetizione di n palline da un’urna che ne contiene H di cui b bianche e H-b nere dove p=b/H indica la probabilità (costante) di estrarre una pallina bianca in ciascuna estrazione. Variabile casuale binomiale Si effettuano n prove indipendenti. In ognuna si può presentare l’evento A o “successo” con probabilità π oppure l’evento A o “insuccesso” con probabilità 1- π. Il risultato di ogni prova non è influenzato dalle prove precedenti né influisce su quelle successive. La v.c. binomiale esprime il numero di successi in n prove, a prescindere dall’ordine con cui si presentano. La sua funzione di probabilità è X~Bin(n,p), n x P ( X ) = ⋅ π (1 − π )n − x x X=0,1,2,…n 0<π<1 coefficiente binomiale ovvero, considerando l’espressione del coefficiente binomiale: n! P( X ) = ⋅ π x (1 − π )n − x x! n − x! 5 Quindi la v.c. binomiale : è una variabile casuale discreta, che può assumere tutti i valori interi compresi tra 0 (nessun successo) e n (tutte le prove hanno avuto successo); è caratterizzata da due parametri: π (la probabilità di un successo in una singola prova) e n (il numero totale di prove); può essere vista come la somma di n v.c. bernoulliane simili (stesso parametro π) e indipendenti. VALORE MEDIO E ( X ) = E ( X1 + X 2 + … + X n ) = π + π + ........ + π = nπ VARIANZA V ( X ) = V ( X1 + X 2 + … + X n ) = π(1 − π) + π(1 − π) + ..... + π(1 − π ) = nπ(1 − π ) 6 Nota sul coefficiente binomiale n n! = x x! (n − x )! x! = 1 ⋅ 2 ⋅ 3 ⋅ ... ⋅ (x − 1) ⋅ x x fattoriale Si assume che 0! = 1 Esempio con n=7 e x=4 7 1⋅2⋅3⋅ 4⋅5⋅6 ⋅7 = 35 = 4 (1 ⋅ 2 ⋅ 3 ⋅ 4) ⋅ (1 ⋅ 2 ⋅ 3) 7 Esercizio distribuzione Binomiale Da un’analisi storica è noto che la probabilità di successo di uno studente in un test scientifico è pari p=0.8. Estraendo casualmente un campione di 5 studenti (assimilabile a 5 «estrazioni indipendenti con reimmissione») che hanno sostenuto la prova ma non hanno ancora avuto comunicazione dell’esito, determinare: Qual è la probabilità che esattamente 3 studenti superino il test? x = 0,1,2,...,5 X~Binomiale(0.8;5) 5 P(X = 3) = 0.8 3 (1 − 0.8)5 −3 = 0.20 3 8 Esempio distribuzione Binomiale 5 P(X = 0) = 0,80 (1 − 0,8)5−0 = 0,0032 0 P(x) 5 P(X = 1) = 0,81(1 − 0,8)5−1 = 0,006 1 5 P(X = 2) = 0,82 (1 − 0,8)5−2 = 0,05 2 5 P(X = 3) = 0,83 (1 − 0,8)5−3 = 0,20 3 0 1 2 3 4 5 x 5 P(X = 4) = 0,84 (1 − 0,8)5− 4 = 0,41 4 5 P(X = 5) = 0,85 (1 − 0,8)5−5 = 0,33 5 9 Esempio distribuzione Binomiale Qual è la probabilità che almeno 3 studenti superino il test? X~Binomiale(0,8;5) x = 0,1,2,...,5 P(X ≥ 3) = P(X = 3) + P(X = 4) + P(X = 5) = 5 3 5 5 5 5 −3 4 5− 4 = 0,8 (1 − 0,8) + 0,8 (1 − 0,8) + 0,8 (1 − 0,8)5−5 = 3 4 5 = 0,20 + 0,41 + 0,33 = 0,94 Qual è la probabilità che al massimo due studenti superino il test? P(X ≤ 2) = 1 − P(X ≥ 3) = 1 − 0,94 = 0,06 10 Distribuzione Binomiale Quando π=0,5 la distribuzione è simmetrica intorno al valore medio In ogni caso, la distribuzione tende ad essere simmetrica per n → +∞ 11