CAPITOLO QUARTO – DISTRIBUZIONE BINOMIALE (O DI BERNOULLI) Molti degli esempi che abbiamo presentato nei capitoli precedenti possono essere pensati come casi particolari di uno schema generale di prove ripetute, ad esempio successivi lanci di un dado, di una moneta, estrazioni di palline da un’urna, di carte da un mazzo (in questi ultimi due casi reimmettendo la pallina o la carta nell’urna o nel mazzo), estrazioni di numeri del lotto in settimane successive, e così via. Lo schema generale può essere descritto mediante la seguente definizione: Si dice esperimento di Bernoulli una sequenza di n prove con le seguenti caratteristiche: 1) il risultato di ogni prova può essere solo “successo” o “fallimento”; 2) il risultato di ciascuna prova è indipendente dai risultati delle prove precedenti; 3) la probabilità p di “successo”, e quindi la probabilità q = 1 – p di “fallimento”, sono costanti in ciascuna prova. Ci proponiamo ora di determinare la probabilità che, in n prove di un esperimento di Bernoulli, si abbiano esattamente k successi. Indichiamo con S il successo e con F il fallimento. Una sequenza di n prove darà, per la 1), come esito una sequenza di n fra S e F. Ad esempio, una sequenza che contiene k successi è la seguente: k volte n– k volte 6 78 678 SS ... S FF... F Se p è la probabilità di S e q la probabilità di F, la probabilità di ottenere proprio quella sequenza è, trattandosi di eventi indipendenti e applicando la regola della probabilità composta: k7 volte n4 –k7 volte 6 4 4 86 4 8 p⋅ p⋅... ⋅ p q⋅ q⋅...⋅q = p k ⋅ q n– k È immediato convincersi che una qualsiasi altra sequenza contenente esattamente k successi k n –k avrà sempre come probabilità p ⋅ q (cambia l’ordine dei fattori, ma non il prodotto). Per determinare in quanti modi si possono ottenere k successi in n prove, basta scegliere tra gli n numeri 1, 2, ..., n i k che contrassegnano i posti occupati dai successi: ciò può essere eseguito in C n,k modi (non essendo rilevante l’ordine in cui tali posti vengono scelti). In definitiva si hanno C n,k possibilità di ottenere k successi in n prove e ciascuna di esse ha, k n –k come si è detto, probabilità p ⋅ q . Dato che queste possibilità distinte corrispondono al realizzarsi di eventi incompatibili (evidentemente il realizzarsi di una certa sequenza di S e F è incompatibile con il verificarsi di un’altra di tali sequenze), per la regola delle probabilità totali, la probabilità cercata, che indichiamo con pn (k) , è: pn (k) = C n, k ⋅ p k ⋅q n –k (con q = 1 – p) o, usando la notazione dei coefficienti binomiali: n n! k n– k pn (k) = p k ⋅ q n –k = ⋅p ⋅q k!(n– k )! k Esempio 1. Determinare la probabilità che su 12 lanci di una moneta buona si ottengano esattamente 8 teste. Si tratta di un esperimento di Bernoulli in cui il “successo” coincide con “esce T”; quindi p = 12 1 8 1 4 12 1 12 ⋅11⋅10 ⋅ 9 1 1 q = e si ha: p12 (8) = ⋅ ⋅ = ⋅ 12 = ⋅ 12 ≅ 0,1208. 4 ⋅3 ⋅2 2 8 2 2 4 2 2 Esempio 2. Determinare la probabilità che estraendo per 5 volte una carta da un mazzo da 40 (inserendo ogni volta la carta estratta e rimescolando bene il mazzo) si ottengano: a) esattamente 3 figure b) almeno 3 figure c) almeno una figura 1 Si osservi che, se non si reintroducesse la carta nel mazzo, l’esperimento non sarebbe di Bernoulli, in quanto la probabilità di estrarre una figura cambierebbe ad ogni successiva estrazione. In questo caso, invece, si tratta di un esperimento di Bernoulli in cui il “successo” 12 è l’estrazione di una figura, per cui p = = 0,3 (e q = 1 – 0,3 = 0,7). 40 a) La probabilità di ottenere esattamente 3 figure è: 5 p5 (3) = ⋅ 0,33 ⋅0,7 2 = 10⋅ 0,33 ⋅ 0,72 = 0,1323 3 b) La probabilità di ottenere almeno 3 figure è la somma delle probabilità di ottenere esattamente 3, 4 o 5 figure: p5 (3) + p5 (4) + p5 (5) = 0,1323 + 0,0284 + 0,0024 = 0,1631 c) Per rispondere a quest’ultima domanda si può procedere come in b) calcolando: p5 (1) + p 5 (2) + p 5 (3) + p 5 (4) + p 5 (5) È tuttavia molto più rapido considerare la probabilità dell’evento contrario, ossia la 5 probabilità di non ottenere alcuna figura: p5 (0) = ⋅ 0,30 ⋅ 0,75 = 0,75 = 0,16807, per cui la 0 probabilità di ottenere almeno una figura è 1 – 0,16807 = 0,83193. Esempio 3. Un tiratore colpisce un bersaglio con probabilità 0,2. Qual è la probabilità che su 8 tiri colpisca 2 volte il bersaglio? E che lo colpisca almeno due volte? Essendo p = 0,2 (e quindi q = 1 – 0,2 = 0,8) la probabilità di “successo”, si ha: 8 8⋅ 7 2 6 2 6 ⋅ 0,2 ⋅ 0,8 ≅ 0,2936 p8 (2) = ⋅ 0,2 ⋅ 0,8 = 2 2 Per rispondere alla seconda domanda è più conveniente determinare le probabilità che il tiratore non colpisca il bersaglio o che lo colpisca esattamente una volta: 8 8 p8 (0) = ⋅ 0,2 0 ⋅ 0,88 ≅ 0,1678; p8 (1) = ⋅ 0,21 ⋅ 0,88 = 8 ⋅0,2 ⋅ 0,88 ≅ 0,3355 0 1 Per la regola della probabilità dell’evento contrario, la probabilità che il tiratore colpisca almeno due volte il bersaglio è 1 – (0,1678 + 0,3355) = 0,4967. Dato un esperimento di Bernoulli, una volta fissato il numero delle prove e la probabilità p di “successo”, il numero k di sucecssi può essere visto come una variabile casuale avente come valori i numeri da 0 a n e le cui rispettive probabilità si determinano con la formula precedente. Tale distribuzione di probabilità prende il nome di distribuzione binomiale. Le variabili casuali degli Esempi 1 e 5 del capitolo precedente hanno una distribuzione binomiale 1 p = q = . I valori delle probabilità delle distribuzioni binomiali relative ai valori di n fino 2 a 12 e ad alcuni valori di p sono riportate nella Tavola in Appendice a questo capitolo. Se p = 1 q= l’istogramma delle variabili casuali con distribuzione binomiale è simmetrico rispetto 2 1 al valore medio. Questa circostanza non si verifica se p ≠ . Vediamo due esempi. 2 Esempio 4. Un’urna contiene 10 palline di cui 3 bianche. Si eseguono 4 successive estrazioni rimettendo ogni volta la pallina estratta nell’urna. Determinare la distribuzione di probabilità della variabile casuale X = “numero di palline bianche estratte” e rappresentarla con un istogramma. 2 La probabilità di estrarre una pallina bianca è 0,3. La variabile casuale X ha come possibili valori 0, 1, 2, 3 e 4 e le rispettive probabilità sono p4 (0), p 4 (1), p 4 (2), p 4 (3), p 4 (4) . Determiniamo tali valori ricorrendo alla Tavola: X 0 0,2401 1 0,4116 2 0,2646 3 0,0756 4 0,0081 L’istogramma risulta: Esempio 5. Rappresentare con un istogramma la distribuzione binomiale con n = 10 e p = 0,9. Per sfruttare la Tavola 1 anche in questo caso, occorre osservare che avere probabilità 0,9 di successo equivale ad avere probabilità 0,1 di insuccesso. Quindi, ottenere 3 successi in 10 prove equivale ad ottenere 7 insuccessi, per cui p10 (3) con p = 0,9 si può leggere in corrispondenza di p10 (7) con p = 0,1, e così via: X 0 1 2 3 4 5 6 7 8 9 10 0,0000 0,0000 0,0000 0,0000 0,0001 0,0015 0,0112 0,0574 0,1937 0,3874 0,3487 (dove compare 0,0000 non si intende evidentemente probabilità nulla, ma un valore molto basso, inferiore a 0,00005). L’istogramma è il seguente: Per una variabile casuale con distribuzione binomiale si può dimostrare che: il valore medio è: E(X) = np la varianza vale: var(X) = npq e la deviazione standard risullta: npq . 3 TAVOLA 1 LA DISTRIBUZIONE BINOMIALE (valori di pn (k) per n da 2 a 12 e p = 0,1; 0,2; 0,3; 0,4; 0,5 4 5