1 CAPITOLO 7 DISTRIBUZIONI DI PROBABILITA’ Lo schema delle prove ripetute e i numeri di Pascal Consideriamo il caso di un processo ricorrente, come il lancio ripetuto di una moneta e chiediamoci: in quanti casi, su n lanci, esce testa m volte (0 ≤ m ≤ n) ? Ad esempio, 3 volte su 4 lanci. Per questo scopo costruiamo il seguente grafo. 1 n =1 1(t) 1(c) n=2 1(tt) 2(tc) 1(cc) n=3 1(ttt) 3(ttc) 3(tcc) 1(ccc) n = 4 1(tttt) 4(tttc) 6(ttcc) 4(tccc) 1(cccc) m=4 m=3 m=2 m =1 m=0 Si legge così: in colonna dall’alto verso il basso è indicato il numero di lanci, n, mentre in orizzontale da sinistra verso destra, ad esempio, il numero di successi, m. I numeri presenti in corrispondenza di ogni nodo rappresentano il numero di cammini, corrispondente al totale degli esiti favorevoli. Nel caso proposto, il nodo 4(tttc) dice che i modi in cui si ! 4 $ 4! = 4 . La possono ottenere m = 3 teste in n = 4 lanci è # &= 3! 4 − 3 ! " 3 % ( probabilità che ciò accada è quindi p(tttc) = ) 4 1 = = 0, 25 . 24 4 I numeri presenti in ogni nodo si chiamano numeri di Pascal, e lo schema presentato si dice triangolo di Pascal. I numeri di Pascal si indicano con il simbolo ! n $ # & " m % ed hanno le due seguenti importanti proprietà: ! n $ n &=2 , m=0 " m % ! n $ ! n −1 $ ! n −1 $ # &=# &+# &. " m % " m −1 % " m % n La somma per righe è pari al numero di casi possibili: ∑ # La regola di formazione di ognuno è: Lo schema delle prove ripetute funziona, ad esempio, anche nel caso del lancio ripetuto di un dado. Per esempio, qual è la probabilità che su 7 lanci esca il 4 esattamente 3 volte? 2 Applichiamo la regola di formazione per valutare il numero di casi del tipo ! 7 $ 444xxxx , # & = 35 , " 3 % 3 !1$ ! 5$ # & # & "6% "6% ognuno dei quali ha probabilità che esca il 4 esattamente 3 volte in 7 lanci è quindi 4 . La probabilità ! 7 $! 1 $3 ! 5 $4 p(444xxxx) = # &# & # & . " 3 %" 6 % " 6 % I numeri di Pascal e gli insiemi Un’interessante applicazione dei numeri di Pascal è data dalla determinazione del numero di sottoinsiemi di m elementi scelti da un insieme di n ! n $ # & . Infatti, come " m % ! $ moneta, # n & rappresenta " m % elementi. Questo numero è proprio il numero di Pascal abbiamo visto nel caso del lancio ripetuto di una il numero di cammini che conducono, nel grafo, a quella determinata n-pla: basta associare ad ognuno dei cammini uno degli insiemi che si possono formare, e il gioco è fatto. Variabili aleatorie discrete Galileo Galilei fu interpellato circa il fatto che, nel gioco in cui si lanciavano tre dadi e si puntava sulla somma dei numeri usciti, il 10 compariva più spesso del 9. Il grande scienziato studiò il problema, e lo risolse nel suo scritto Considerazioni di Galileo sopra il gioco dei dadi. Ciò che lasciava perplessi i giocatori che si rivolsero a Galileo, era che il numero di terne utili a comporre la somma 10, ovvero 6, era uguale a quello delle terne utili a comporre la somma 9. Analizzando le terne in questione, Galileo osservò che il numero di modi in cui si potevano presentare le singole terne era così distribuito: 10 : 631(6) 541(6) 9 : 621(6) 531(6) 532(6) 442(3) 433(3) 522(3) 441(3) 432(6) 622(3) = 27 333(1) = 25 I numeri a fianco delle terne sono i numeri di Pascal, che contano i modi con cui la terna si può comporre. Se pensiamo che il numero di terne possibili che si possono formare lanciando 3 dadi è 63 = 216 , allora lo scarto tra le frequenze relative al 10 ed al 9 è 1 : è decisamente ragguardevole il 108 fatto che i due giocatori si siano accorti di questa differenza! Analizziamo nel dettaglio il gioco di cui sopra. I valori possibili per le somme vanno da 3 (111) a 18 (666). Chiamiamo variabile aleatoria (discreta) il 3 valore della somma su cui puntare, e lo indichiamo con X . Esaminiamo il quadro generale, dove nella prima colonna è ripotato il valore della variabile aleatoria, in quelle centrali sono riportate le terne favorevoli, infine, nell’ultima colonna, sono riportati i valori della probabilità di ciascuna variabile aleatoria. X terne P(X ) 3 111 1 / 216 4 121 3 / 216 5 113 122 6 114 123 222 7 115 124 133 8 116 125 134 224 233 21 / 216 9 126 135 144 234 252 333 25 /16 10 136 145 226 235 334 27 / 216 11 146 155 236 245 335 344 27 / 216 12 156 246 255 336 25 / 216 13 166 256 346 14 266 356 446 15 366 456 555 16 466 556 17 556 3 / 216 18 666 1 / 216 6 / 216 10 / 216 223 15 / 216 244 345 355 445 455 444 21 / 216 15 / 216 10 / 216 6 / 216 Con il concetto di variabile aleatoria è possibile estendere la definizione di guadagno medio. Stabilito un determinato esperimento, si associa ad ogni evento elementare la relativa probabilità, ed un certo numero variabile da evento ad evento (la variabile aleatoria, appunto). Ad esempio, nell’esperimento del lancio dei tre dadi, il valore della somma è la variabile aleatoria, le terne che ne permettono l’uscita costituiscono l’evento, la probabilità che associamo alla variabile aleatoria è il rapporto tra il numero di terne favorevoli e quello di tutte le terne possibili. Si definisce quindi valore medio della variabile aleatoria la somma dei prodotti dei suoi valori per le rispettive probabilità. Se X è una variabile aleatoria finita, che assume i valori x1,x2 ,...,x N , con distribuzione di probabilità p1, p2 ,..., pN , si dice valore atteso di X o media il numero reale: N x = ∑ xi pi . i=1 4 Ad esempio, nel lancio dei tre dadi, il valore medio della somma è X= 3⋅1+4⋅3+5⋅6+6⋅10+7⋅15+8⋅21+9⋅25+10⋅27+11⋅27+12⋅25+13⋅21+14⋅15+15⋅10+16⋅6+17⋅3+18⋅1 = 10, 5 . 216 Riportiamo i valori della variabile aleatoria su grafico ad istogramma. X 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 numero(terne 1 3 6 10 15 21 25 27 27 25 21 15 10 6 3 1 216 P(X) 0,00462963 0,01388889 0,02777778 0,0462963 0,06944444 0,09722222 0,11574074 0,125 0,125 0,11574074 0,09722222 0,06944444 0,0462963 0,02777778 0,01388889 0,00462963 1 0,01388889 0,05555556 0,13888889 0,27777778 0,48611111 0,77777778 1,04166667 1,25 1,375 1,38888889 1,26388889 0,97222222 0,69444444 0,44444444 0,23611111 0,08333333 10,5 X = 10,5 30( 25( 20( 15( 10( 5( 0( 3( 4( 5( 6( 7( 8( 9( 10( 11( 12( 13( 14( 15( 16( 17( 18( Varianza e deviazione standard di una variabile aleatoria Nello studio della statistica descrittiva abbiamo già introdotto il concetto di dispersione di una variabile statistica intorno alla sua media e abbiamo introdotto una misura di questa dispersione introducendo i concetti di varianza e di deviazione standard. Gli stessi concetti possono essere impiegati nello studio delle variabili aleatorie. Pensiamo di rappresentare l'insieme {x1,x2 ,...,x N } dei valori assunti da una variabile aleatoria X, sull'asse reale, e di rappresentare anche il suo valore atteso x . 5 La varianza di X è definita come: 2 N ( var(X ) = σ = ∑ x j − x j=1 ) 2 pj . Essa rappresenta quindi la media ponderata dei quadrati delle distanze dai valori assunti dalla X rispetto alla media della variabile aleatoria, prendendo come pesi le probabilità della corrispondente distribuzione. La varianza può anche essere vista come il valore medio della variabile 2 aleatoria ( X − x ) . Osserviamo che la varianza è nulla solo a condizione che la X assuma un solo valore con probabilità 1, cioè che sia costante. La varianza costituisce una buona misura della dispersione di una variabile aleatoria ed è additiva per le variabili indipendenti ma, come abbiamo già osservato nello studio della statistica descrittiva, ha un difetto: non è dimensionalmente omogenea alla variabile X. Per superare questo inconveniente si considera lo scarto quadratico medio o deviazione standard, definito come: σ = var ( X ) . La deviazione standard è meno agevole da utilizzare della varianza, poiché non è additiva. Vedremo in seguito alcune applicazioni della varianza e della deviazione standard. Esempio Nel lancio di due dadi non truccati, si calcoli il valore medio della variabile aleatoria differenza in valore assoluto dei punteggi ottenuti. X p(x) xp(x) ( x−x 2 ) p (x) 0 6/36 0 0,6301 1 10/36 10/36 0,2478 2 8/36 16/36 0,0007 3 6/36 18/36 0,1857 4 4/36 16/36 0,4695 5 2/36 m 10/36 35/18 0,5187 2,0525 6 Lo scarto quadratico medio è quindi σ ( X ) = var ( X ) = 2,0525 =1,43 . Esempi 1. Si lanciano due dadi, uno regolare e l’altro truccato. In quest’ultimo la probabilità che esca un numero pari è tripla di quella che esca un numero dispari. Si confrontino i valori medi dei punteggi ottenuti lanciando i due dadi. • Nel caso del dado regolare il calcolo del valore medio del punteggio è Xr = 1+ 2 + 3+ 4 + 5 + 6 = 3, 5 , mentre in quello del dado 6 truccato occorre determinare la probabilità 3p che esca un numero pari, e che quella che esca un numero dispari, p . Dovrà 1 , di conseguenza 12 1 3 1 3 1 3 Xt = 1⋅ + 2 ⋅ + 3⋅ + 4 ⋅ + 5⋅ + 6 ⋅ = 3, 75 . 12 12 12 12 12 12 risultare 3⋅ 3p + 3⋅ p = 1 ⇒ p = 2. Nel lancio di due dadi non truccati, si calcoli il valore medio della variabile aleatoria differenza in valore assoluto dei punteggi ottenuti. • X p(x) 0 1 2 6/36 10/36 8/36 xp(x) 0 3 6/36 4 4/36 5 2/36 Valor medio 10/36 16/36 18/36 16/36 10/36 35/18 3. Si lanciano contemporaneamente un dado e una moneta le cui facce sono contrassegnate dai numeri 2 e 3. Si consideri la variabile aleatoria X = “ differenza, in valore assoluto, tra il prodotto e la somma dei numeri usciti “. Dopo aver rappresentato in modo schematico i valori possibili, corredati delle rispettive probabilità, si calcoli il valore medio della variabile aleatoria. • X 0 1 2 3 4 5 7 9 p(x) 1/12 4/12 1/12 2/12 1/12 1/12 1/12 1/12 xp(x) 0 4/12 2/12 6/12 4/12 5/12 7/12 9/12 7 Il valore medio della variabile aleatoria è ∑ XP(X) = 37 . 12 4. Si lanciano 5 volte due dadi regolari. Si consideri la variabile aleatoria X = “numero di volte in cui il prodotto delle facce è ≥ 20 “. Dopo aver rappresentato in modo schematico i valori possibili, corredati delle rispettive probabilità, si calcoli il valore medio della variabile aleatoria. • La probabilità che il prodotto delle facce sia ≥ 20 è # 5 &# 2 &k # 7 &5−k 2 7 p = ⇒ q = 1− p = ⇒ P ( X = k ) = % (% ( % ( , k = 0,1, 2, 3, 4, 5 . 9 9 $ k '$ 9 ' $ 9 ' X 0 1 2 3 4 5 Xp(X) 0,284628021 0,406611458 0,232349405 0,066385544 0,009483649 0,000541923 0 0,406611458 0,464698809 0,199156633 0,037934597 0,002709614 1,111111111 (media) F(X) 0,284628021 0,691239479 0,923588884 0,989974428 0,999458077 p(X) 1 Notiamo che nell’ultima riga è stata riportata la cosiddetta funzione di ripartizione, ottenuta sommando progressivamente le probabilità relative ai valori assunti dalla variabile aleatoria (teorema della somma delle probabilità). DISTRIBUZIONI DI PROBABILTA’ Introduzione Si ha una distribuzione di probabilità quando al valore assunto dalla variabile aleatoria, viene associata la relativa probabilità. Indicata al solito con X la variabile aleatoria, si definisce funzione di ripartizione F ( x ) la probabilità che la variabile aleatoria assuma un valore non superiore a x: F x := p X ≤ x . () ( ) In generale, F b − F a := p a ≤ X ≤ b . () () ( ) Ricordiamo le definizioni di media e di varianza di una variabile aleatoria discreta: x := M X = ∑ xk pk . 2 2 σ X = ∑ xk − x pk ( ) ( ) ( ) Distribuzione binomiale o di Bernoulli Consideriamo esperimenti, riguardanti variabili aleatorie discrete, che possono dare due esiti, come ad esempio il lancio di una moneta, o 8 l’estrazione di una pallina da un’urna contenente palline di due soli colori. Se p è la probabilità che un evento si verifichi, allora q =1− p è la probabilità che l’evento non si verifichi. Esempio. Un’urna contiene 25 palline, di cui 10 bianche e 15 nere. Calcolare la probabilità che, su 5 estrazioni con reinserimento nell’urna della pallina estratta: 1. Le prime tre palline siano bianche; • Gli esiti favorevoli all’evento sono: BBBBB-BBBBN-BBBNBBBBNN. La probabilità si ottiene sommando la probabilità delle cinquine individuate, in virtù dell’incompatibilità degli eventi: 5 4 !2$ !2$ + 2 # & # & "5% "5% 3 !3$ !2$ # &+# & "5% "5% 2 !3$ # & = 0,064 = 6,4% . "5% 2. Soltanto le prime tre siano bianche • Gli esiti favorevoli all’evento sono: BBBNN. La probabilità è 3 !2$ # & "5% 2 !3$ # & = 0,02304 = 2,304% "5% 3. Escano tre palline bianche; • Il numero di esiti favorevoli all’evento è dato dalle combinazioni di 5 elementi presi a 3 per volta. La probabilità è quindi ! 5 $! 2 $3 ! 3 $2 # &# & # & = 0,2304 = 23,04% . 3 " %" 5 % " 5 % Soffermiamoci sull’ultimo caso esaminato nell’esempio, e cerchiamo di generalizzarlo. Possiamo affermare che la probabilità di conseguire h successi (ognuno con probabilità p ) su n prove è data dalla relazione: ! $ Ph = # n & p h q n−h " h % q =1− p . Si parla di distribuzione facendo riferimento allo studio di tutti i possibili esiti, ovvero dei possibili valori che può assumere la variabile aleatoria discreta riferita all’evento considerato. Esempio. Si lancia 4 volte una moneta regolare, sempre nelle stesse condizioni. Studiamo la variabile aleatoria “numero di volte che esce testa”. 9 Riassumiamo nella seguente tabella le 5 possibilità: 0 X 1 0 p X ! 4 $! 1 $ # &# & " 0 %" 2 % ∑ p(X ) = ( ) ( ) Xp X 1 16 0 4 !1$ # & "2% 2 1 ! 4 $! 1 $ # &# & " 1 %" 2 % 4 = 16 5 = 16 3 !1$ # & "2% 4 16 3 2 ! 4 $! 1 $ # &# & " 2 %" 2 % 6 = 16 11 = 16 2 !1$ # & "2% 12 16 4 3 ! 4 $! 1 $ # &# & " 3 %" 2 % 4 = 16 15 = 16 1 !1$ # & "2% 12 16 ! 4 $! 1 $4 ! 1 $0 # &# & # & " 4 %" 2 % " 2 % 1 = 16 16 = =1 16 4 16 Il valore medio della variabile aleatoria è x = ∑ xp ( x ) = 2 , mentre lo scarto 2 quadratico medio è σ = ∑( x − x ) p ( x ) =1 . La distribuzione che abbiamo appena visto prende il nome del matematico J. Bernoulli (1654-1705), considerato tra i fondatori del moderno calcolo delle probabilità, autore dell’opera, pubblicata postuma nel 1713, Ars conjectandi. Osserviamo i seguenti fatti, relativi alla distribuzione di Bernoulli, facendo riferimento all’esempio trattato. 1. Simmetria della distribuzione: la probabilità che esca h volte testa è uguale a quella che esca n − h volte croce. Questa proprietà vale 1 2 soltanto nel caso particolare p = q = . 2. Condizione di normalizzazione: la somma delle probabilità è uguale a 1. Questa probabilità vale sempre, per l’incompatibilità degli eventi. 3. In genere, la probabilità che la variabile aleatoria assuma un qualsiasi valore è abbastanza bassa. Questo fatto è conseguenza di un numero di prove abbastanza elevato. 4. Il valore della variabile aleatoria che presenta la massima probabilità è n n n +1 se n è pari, la parte intera di oppure se n è dispari. 2 2 2 5. La media della distribuzione binomiale è x = np . 6. Lo scarto quadratico medio della distribuzione binomiale è σ = npq . 10 Esercizi 1. Lanciare un dado 4 volte e considerare la variabile aleatoria X = ”numero di volte che esce il 3”. Redigere la tabella delle probabilità completa della righe della funzione di ripartizione, e di quelle necessarie per il calcolo del valor medio della variabile aleatoria e della deviazione standard (scarto quadratico medio). 0 X 0 p X ! 4 $! 1 $ ## &&# & " 0 %" 6 % 625 = 1296 ∑ p(X ) = ( ) ( ) Xp X 1 1 4 ! 4 $! 1 $ # &# & " 1 %" 6 % 500 = 1296 !5$ # & "6% 625 1296 2 3 2 !5$ # & "6% ! 4 $! 1 $ ## &&# & " 2 %" 6 % 150 = 1296 1125 1296 500 1296 3 ! 4 $! 1 $ ## &&# & " 3 %" 6 % 20 = 1296 !5$ # & "6% 1275 1296 300 1296 = 0 3 2 4 ! 4 $! 1 $4 ! 5 $0 # &# & # & " 4 %" 6 % " 6 % 1 = 1296 1 !5$ # & "6% 1295 1296 60 1296 = 1296 =1 1296 4 1296 = = • Il numero medio di uscite del “3” è quindi x = ∑ xp ( x ) = 864 = 0,67 , 1296 2 mentre lo scarto quadratico medio è σ = ∑( x − x ) p ( x ) = 0,56 . 2. A 4 giorni dalla data di effettuazione di un volo, una compagnia aerea constata che sono rimasti 16 posti liberi, e sa che l’80% di coloro che acquistano il biglietto partono effettivamente. Qual è la probabilità di overbooking? # 20 & • p 17 ≤ k ≤ 20 = ∑ p x = ∑ %% (( 0,80 k $ ' k=17 k=17 20 ( ) 20 () ( k ) (0,20) 20−k = 0,411 . 3. Un politico stima che il 25% dei senatori appoggerà una sua proposta di legge. Qual è la probabilità che almeno un senatore su 5 scelti a caso appoggi la proposta? Qual è la probabilità di ottenere l’appoggio dalla maggioranza dei senatori? 0 1 2 3 4 5 X 0,2373 0,3955 0,2637 0,0879 0,0146 0,0010 p (x) ∑ p (x) 0,2373 0,6328 0,8965 0,9844 0,999 1 () 0 0,3955 0,5274 0,2637 0,0584 0,005 0,3708 0,0247 0,0165 0,2692 0,1104 0,0141 xp x ( x−x 2 ) () p x 11 • Il numero medio di senatori disposti ad appoggiare la proposta di legge è quindi x = ∑ xp ( x ) =1,25 , con uno scarto quadratico medio è 2 σ = ∑( x − x ) p ( x ) = 0,81. p ( x ≥1) =1− p (0) = 0,7627 , p x ≥ 3 = 0,0879 + 0,0146 + 0,001= 0,1035 . ( ) Distribuzione di Poisson Consideriamo il caso del decadimento di un campione radioattivo, e domandiamoci: “quanti decadimenti dovremmo aspettarci ( k ) ogni ΔT minuti se il campione è costituito da n nuclei?” Viene piuttosto naturale inquadrare il problema nell’ambito della distribuzione binomiale. Infatti, se p è la probabilità che ha ogni nucleo di decadere, allora la probabilità che si verifichino k decadimenti in ! $ n−k ΔT minuti è # n & p k 1− p . " k % C’è un problema non di poco conto: la dimensione del campione (di solito n ≈ 1020 ) e il valore della probabilità di successo ( p ≈ 10−20 ). Con questi ordini di grandezza, la distribuzione binomiale può essere approssimata con una funzione più semplice, detta distribuzione di Poisson, che esprime la probabilità di osservare k decadimenti in un intervallo di tempo fissato ΔT : k ! n $ k n−k −λ λ ≈e , # & p 1− p k ! " k % dove λ è il numero medio di eventi (decadimenti) per intervallo di tempo. Infatti: k n−k k n−k # n & k n−k n! # λ & # λ & n(n −1) ⋅...⋅ (n − k +1) # λ & # λ & lim % ( p q = lim % ( %1− ( = lim % ( %1− ( = n→∞ n→∞ k !(n − k)! n n→∞ n k ! k $ ' $ ' $n' $ n' $ ' ( ) ( ) −λ n + − . −k k # λ n(n −1) ⋅...⋅ (n − k +1) λ λ& 0 # λ& λ k −λ lim %1− ( %1− ( = e n→∞ k ! -$ n ' 0 $ n ' k! nk -, 0/ In definitiva, possiamo dimostrare le seguenti proprietà della distribuzione di Poisson: 12 1. La media della distribuzione di Poisson è x = λ . 2. Lo scarto quadratico medio della distribuzione Poisson è σ = λ . Esperimento (particolarmente indicato per studenti del Liceo Castelnuovo di Firenze!) Scegliamo un’ora “di punta”, ad esempio dalle 12:00 alle 13:00, di un giorno feriale, e posizioniamoci in corrispondenza del semaforo posto all’incrocio tra viale Matteotti e via La Marmora. L’esperimento è il seguente: si contano i veicoli a motore che transitano tra due luci verdi del semaforo consecutive, e tra questi quelli che girano a destra in via La Marmora. Lo scopo dell’esperimento è quello di verificare se ci troviamo in presenza di una distribuzione di Poisson. Infatti, la scelta dell’ora di punta va incontro alla richiesta di “campione numeroso” (le automobili che passano tra due verdi consecutivi) e la scelta dell’incrocio a quella in cui la probabilità che l’evento accada è bassa (trattandosi via La Marmora di corsia “preferenziale”, le automobili che girano a destra dovrebbero essere poche). Staranno veramente così le cose? Esercizio In un famoso esperimento, Rutherford insieme ad altri fisici, contò il numero delle particelle α emesse da una pellicola di polonio. Furono considerati 2608 intervalli di tempo successivi ottenendo i seguenti risultati : Numero di particelle 0 Frequenza 57 1 2 3 4 5 6 7 203 383 525 532 408 273 139 8 9 10 45 27 16 Qual è il numero medio di particelle α emesse in un intervallo di tempo? Qual è la probabilità che il numero delle particelle emesse in dato intervallo di tempo siano più di 4? • x = 3,9 p(x > 4) =1− "# p(0) + p(1) + p(2) + p(3) + p(4)$% = 0,35 . 13 x f(x) 0 1 2 3 4 5 6 7 8 9 10 57 203 383 525 532 408 273 139 45 27 16 p(x) 0,021855828 0,077837423 0,146855828 0,201303681 0,20398773 0,156441718 0,104677914 0,053297546 0,017254601 0,010352761 0,006134969 1 prob.Poisson 0,020914109 0,080881787 0,156398333 0,201614722 0,194927731 0,150770022 0,097179604 0,053689389 0,025954332 0,011152667 0,004313106 F(x) 0,021855828 0,099693252 0,24654908 0,447852761 0,651840491 0,808282209 0,912960123 0,966257669 0,98351227 0,993865031 1 xp(x) 0 0,077837423 0,293711656 0,603911043 0,81595092 0,782208589 0,628067485 0,373082822 0,13803681 0,093174847 0,061349693 3,867331288 valormedio (x-xmedio)^2p(x) 0,326881259 0,639947281 0,512075426 0,151433424 0,003590385 0,200705089 0,476104027 0,523041504 0,294690483 0,272736112 0,230733899 1,905764647 deviazione standard L’istogramma blu rappresenta la probabilità calcolata con i rilevamenti effettivi del numero di particelle emesse, mentre quello in rosso la distribuzione di probabilità di Poisson. Esercizi 1. I clienti di un supermercato arrivano alla cassa al ritmo medio di tre al minuto. Si calcoli la probabilità che in un dato minuto avvengano al massimo due arrivi, nell’ipotesi che questi seguano una distribuzione di Poisson. 2. La media d’infortuni in una fabbrica segue la distribuzione di Poisson con media mensile 2,6. a) Qual è la probabilità che in mese gli 14 infortuni siano meno di due? b) Qual è invece la probabilità che, sempre in un dato mese, gli infortuni siano più di tre? 3. Nel periodo seguente la consegna dell’ormai leggendario pagellino, la segreteria della scuola riceve 4,2 e-mail in media, al giorno, da parte dei genitori degli studenti. Se queste seguono una distribuzione di Poisson, qual è la probabilità di riceverne almeno tre? 4. Un’importante azienda agricola possiede 250 trattori. La probabilità che uno di questi, in una determinata settimana, richieda un intervento meccanico è 0,01. Si trovi la probabilità che, in una data settimana, meno di 4 trattori richiedano un intervento meccanico. Si approssimi la distribuzione binomiale con quella di Poisson. 5. Una compagnia di assicurazioni stipula 6.000 polizze. La probabilità che, in un anno, il titolare di una polizza richieda un indennizzo è 0,001. Si calcoli la probabilità che, in quell’anno vengano presentate almeno tre richieste d’indennizzo. Si approssimi la distribuzione binomiale con quella di Poisson. 6. In uno Stato dell’Unione l’assicurazione di responsabilità civile per i ciclisti è obbligatoria per legge. Nonostante ciò, il 7,5% dei ciclisti non la possiede. Scelto un campione casuale di 60 ciclisti, si calcoli la probabilità che almeno 3 di questi non sia assicurato. Soluzioni () 1. p k = e −x 0 1 2 xk −3 3 −3 3 −3 3 ⇒ p x ≤2 =e +e +e = 0,4232 . k! 0! 1! 2! ( ) () 2. X= numero d’infortuni in un mese, x = 2,6 ⇒ p k = e −2,6 ( ) p ( x > 3) =1− p(0) − p(1) − p(2) − p(3) = 0,2640 . p x < 2 = p(0) + p(1) = 0,2674 , b) ( ) 2,6 k! k . Quindi a) 15 () 3. X= numero di e-mail ricevute dalla segreteria, x = 4,2 ⇒ p k = e −4,2 ( ( ) 4,2 k k! . ) p x ≥ 3 =1− p(0) − p(1) − p(2) = 0,7898 . 4. X= numero di guasti che si verificano su una tangenziale ogni giorno, () ( ) 3,2 k ( ) ; a) p x < 2 = p(0) + p(1) = 0,1712 , b) k! p x > 4 =1− p(0) − p(1) − p(2) − p(3) − p(4) = 0,2194 . x = 3,2 ⇒ p k = e −3,2 ( ) 5. X= numero di richieste d’indennizzo in un anno; se la probabilità che un assicurato richieda un indennizzo è p = 0,001, il valore atteso di richieste in un anno è x = np = 6.000 ⋅ 0,001= 6 , per cui k ! 6.000 $ k 6.000−k −6 6 . Di conseguenza, p k =# ≈e & 0,001 0,999 k! k " % () ( ( )( ) ) p x ≥ 3 =1− p(0) − p(1) − p(2) = 0,9380 . 6. X= numero di ciclisti non assicurati; se la probabilità che un ciclista non sia assicurato è p = 0,075 , il valore atteso di richieste in un anno è x = np = 60 ⋅ 0,075 = 4,5 , per cui k ! 60 $ k 60−k −4,5 4,5 . Di conseguenza, p k =# ≈e & 0,075 0,925 k! " k % () ( ( )( ) ) p x ≥ 3 =1− p(0) − p(1) − p(2) = 0,8264 . Variabili aleatorie continue Decisamente interessante è il caso rappresentato dalle variabili aleatorie continue; in tal caso, se la funzione di ripartizione1 è derivabile, la sua derivata si dice funzione di densità () () F! x = f x , 1Ricordiamo che la funzione di ripartizione di una variabile aleatoria X esprime la probabilità che questa non superi un determinato valore ( ) ( x0 : F x0 = P X ≤ x0 ) −∞ < x0 < +∞ . 16 () ed il termine f x dx rappresenta approssimativamente la probabilità che la variabile aleatoria assuma un valore compreso in un intervallo infinitesimo di ampiezza dx contenente il valore X = x . Riepiloghiamo quanto detto finora nel seguente schema comparativo tra le variabili aleatorie discrete e continue. variabili aleatorie discrete x = ∑ xk pk σ= ∑( ) variabili aleatorie continue +∞ x= ∫ xf ( x ) dx −∞ 2 +∞ xk − x pk σ= ∫( x−x −∞ ∑p k 2 ) f ( x ) dx +∞ =1 ∫ f ( x ) dx =1 −∞ Distribuzione uniforme Si ha una distribuzione uniforme quando è attribuita la stessa probabilità ad ogni elemento dell’insieme su cui è definita. Ad esempio, nel lancio di un dado equilibrato, ogni faccia ha probabilità 1 di uscire. 6 Una variabile aleatoria continua ( a ≤ X ≤ b) ha una distribuzione uniforme se ha una funzione di ripartizione così definita: # 0 % F x =$ x−a b−a % 1 & () ( )( ) se x≤a se a < x ≤ b se x>b La funzione densità è # 0 % f x =$ 1 b−a % 0 & () ( ) se x≤a se a < x ≤ b . se x>b . 17 Osserviamo, innanzi tutto, che b +∞ ∫ () f x dx = a −∞ x= 2 +∞ b −∞ a ∫ xf ( x ) dx = ∫ σ = +∞ 2 ( 3 ) ( ) ) 2 b $ a +b' 1 f x dx = ∫ & x − dx = ) 2 b − a ( a % ( 3 ( ) ) . 3 $b−a' $a −b' $b−a' − 2 & ) & ) & ) b−a % 2 ( % 2 ( % 2 ( = = 12 3 b−a 3 b−a ( ( 1 b−a dx = =1 . Inoltre si ha b−a b−a x b2 − a 2 a + b dx = = ,e 2 b−a 2 b−a ∫ (x − x ) ( ) −∞ ∫ ( ) 2 ) Esempio Una cisterna della capienza di 1000 litri viene riempita ogni mattina, prima dell’apertura della stazione di servizio. Qual è la probabilità di vendere tra 0 e 400 litri di carburante? • Consideriamo la variabile aleatoria X=”numero di litri venduti in un determinato giorno”. La probabilità della variabile aleatoria è distribuita uniformemente perché ogni quantità di carburante x tale che 0l ≤ x ≤1000l ha la stessa probabilità di essere venduta. Di conseguenza, la probabilità di vendere x litri di carburante (ovvero 1 che la variabile aleatoria X assuma il valore x) è P X = x = . La 1000 # 0 x<0 % % x−0 funzione di ripartizione è quindi F x = $ 0 ≤ x ≤1000 . % 1000 − 0 %& 1 x >1000 ( () In particolare, la probabilità richiesta è 400 1 400 P x ≤ 400 = ∫ dx = F 400 = = 0,4 = 40% . 1000 −∞ 1000 ( ) ( ) ) 18 Problema La probabilità che si verifichi un guasto in un punto qualsiasi di una conduttura lunga 2 km è 0,5. Scrivere la densità di probabilità, la funzione di ripartizione, e si calcoli la probabilità che si verifichi un guasto tra il km 1,5 ed il km 2 della conduttura. • In questo caso la variabile aleatoria è X=”si verifica un guasto al km x "$ 0,5 0 ≤ x ≤ 2 x x”. f x = # , F x = ∫ 0,5dt = , 2 $% 0 altrove −∞ () () ( ) () ( ) P 1,5 ≤ x ≤ 2 = F 2 − F 1,5 =1− 0,75 = 0,25 = 25% . Esercizio a) Si dica per quale valore del parametro A, la funzione #% 0; x<0 rappresenta una densità di probabilità. g n (x) = $ n −x %& Ax e ; x ≥ 0 • Per la condizione di normalizzazione: 1= +∞ n −x ∫ Ax e dx = An! ⇒ A = 0 1 . n! b) Si calcolino il valore medio e la deviazione standard della variabile casuale # 0; x<0 % continua la cui densità di probabilità è g2 (x) = $ x 2e −x . ; x ≥ 0 % & 2 (x e ) dx = lim F (x) = 3! = 3 , mentre la Il valor medio è x = ∫ x +∞ • 0 2 −x x→+∞ 3 2 2 deviazione standard è data dalla relazione σ x (x e ) dx = 3 . = ∫ (x − 3) +∞ 2 −x 2 0 2 La distribuzione normale in Fisica. Un’introduzione al Metodo Statistico Supponiamo di aver misurato N volte una grandezza fisica x, e che le misure siano affette soltanto da errori accidentali. La miglior stima del valore N della grandezza è il valor medio x = ∑x k=i N i . Un indice di variabilità 19 comunemente utilizzato a corredo del valor medio è lo scarto quadratico N medio, o deviazione standard, definito come σ x = ∑( xi − x i=1 ) 2 N . Esempio. Sono stati misurati il diametro e la circonferenza di 40 oggetti circolari diversi, al fine di valutare π . Riportiamo i risultati in tabella e facciamo alcune considerazioni. π xk 3,08 3,10 3,11 3,12 3,13 3,14 3,15 3,16 3,17 3,18 3,20 occorrenze 5 3 2 2 10 5 9 1 1 1 1 0,05 0,25 0,125 0,225 0,025 0,025 0,025 0,025 nk frequenze fk = 0,125 0,075 0,05 nk N Quando il numero di dati da trattare è grande e presenta risultati ripetuti (ad esempio il valore calcolato 3,13 è presente 10 volte!) il calcolo della media viene eseguito introducendo il concetto di frequenza: f k = nk , dove N nk indica quante volte è presente il valore xk nella distribuzione (quelle che n nella tabella sono state riportate come occorrenze); ovviamente, ∑n k =N k=1 essendo n i valori distinti xk (nel nostro caso quindi, N = 40 , n =11). Il valore medio e la deviazione standard in termini di frequenze sono rispettivamente: n x = ∑ xk f k = 3,1305 , σ x = k=1 n ∑( x k=1 −x k ) 2 f k = 8 ⋅10−4 . Nel caso in esame (in genere nella misura di grandezze fisiche) si ha un intervallo continuo di valori possibili, e la rappresentazione delle frequenze mediante istogrammi ad intervalli è particolarmente indicata. 20 Quando N è grande, si nota che il diagramma che rappresenta la distribuzione delle frequenze per ciascuna misura (o raggruppamento di misure, come nell’istogramma sopra) può essere approssimato con una curva continua detta distribuzione limite. Nel caso di misure affette soltanto da errori casuali, la distribuzione limite è rappresentata dalla cosiddetta curva normale (o di Gauss), la cui espressione analitica è la seguente: 2 () f x = 1 σ 2π e − ( x−x ) 2σ 2 , ed il grafico, con la caratteristica forma a campana, è rappresentato sotto. In buona sostanza, con la distribuzione limite passiamo dalla coppia valore-frequenza ( xk , f k ) al punto x, f ( x ) . Se poniamo uguale a uno ( ) l’ampiezza della base dei rettangoli che compongono l’istogramma, possiamo dire che l’area di questo è la somma delle frequenze: ∑ fk = ∑ nk N = =1. Questa caratteristica si trova in forma di integrale nella N N 2 funzione di Gauss: +∞ ∫ −∞ 1 σ 2π e − ( x−x ) 2σ 2 dx =1 . Per dimostrare questa importante 21 +∞ proprietà sfruttiamo il risultato ∫e −x 2 dx = π . Posto z = −∞ Di conseguenza, x−x σ 2 ⇒ dx = σ 2dz . 2 +∞ ∫ −∞ 1 σ 2π e − ( x−x ) 2σ 2 1 +∞ dx = ∫ −∞ −z2 σ 2π e σ 2dz = 1 +∞ π ∫e −z2 dz = −∞ π π =1 . 2 Il termine 1 e − ( x−x ) 2σ 2 dx rappresenta quindi la frazione di misure comprese tra σ 2π x e x + dx , che equivale alla probabilità che una misura dia un risultato compreso tra x e x + dx . Nelle applicazioni si ricorre spesso alla distribuzione normale standardizzata, ottenuta mediante la sostituzione formale z = l’espressione y= 1 2π e − z2 2 x−x , da cui segue σ −∞ < z < +∞ , nota come funzione degli errori. In particolare, la probabilità che una misura differisca per t deviazioni standard dalla media è data dalla 2 relazione P ( x − tσ < x < x + tσ ) = x +tσ ∫ 1 e ( x−x ) − 2σ 2 ( () ( t ) ∫ F z =P z<t = −∞ e z2 2 2π −t e z2 2 2π dz . dz per valori di t ≥ 0 la cui lettura avviene con la # % F t seguente modalità: P z < t = $ % 1− F −t & ( ) ∫ dx = P −t < z < t = x −tσ σ 2π Nelle tavole sono di solito tabulati i valori della funzione − t − ) () ( ) t ≥0 t <0 . Riportiamo di seguito le conclusioni del celebre problema proposto a Galileo Galilei, in cui si riassume lo studio della variabile aleatoria discreta “X = somma delle facce nel lancio di 3 dadi”. 22 Il valore medio della somma è X= 3⋅1+4⋅3+5⋅6+6⋅10+7⋅15+8⋅21+9⋅25+10⋅27+11⋅27+12⋅25+13⋅21+14⋅15+15⋅10+16⋅6+17⋅3+18⋅1 = 10, 5 . 216 Riportiamo i valori della variabile aleatoria su grafico ad istogramma. X 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 numero(terne 1 3 6 10 15 21 25 27 27 25 21 15 10 6 3 1 216 P(X) 0,00462963 0,01388889 0,02777778 0,0462963 0,06944444 0,09722222 0,11574074 0,125 0,125 0,11574074 0,09722222 0,06944444 0,0462963 0,02777778 0,01388889 0,00462963 1 0,01388889 0,05555556 0,13888889 0,27777778 0,48611111 0,77777778 1,04166667 1,25 1,375 1,38888889 1,26388889 0,97222222 0,69444444 0,44444444 0,23611111 0,08333333 10,5 X = 10,5 30( 25( 20( 15( 10( 5( 0( 3( 4( 5( 6( 7( 8( 9( 10( 11( 12( 13( 14( 15( 16( 17( 18( Dal grafico sopra sembra esserci una somiglianza tra la distribuzione delle probabilità della variabile aleatoria discreta (binomiale) e la funzione di Gauss. Distribuzione Normale come approssimazione di quella binomiale Quando il numero di prove è molto grande, la distribuzione binomiale può essere approssimata da una funzione, la nota curva a campana (o, più semplicemente, campana) di Gauss: 23 2 () f x = 1 σ 2π e − ( x−x ) 2σ 2 , dove con x = np e σ = npq si sono indicati rispettivamente la media e lo scarto quadratico medio della distribuzione. Esempio. Lanciamo 100 volte una moneta: la distribuzione binomiale è 1 approssimata dalla distribuzione normale di media x = np =100 ⋅ = 50 , e 2 1 1 2 2 scarto quadratico medio σ = npq = 100 ⋅ ⋅ = 5 ; I grafici che seguono sono stati realizzati con il foglio elettronico excel. Interpretazione dei risultati 2 L’equazione della curva normale è f ( x ) = 1 5 2π e − ( x−50) 50 . La probabilità che esca testa un numero di volte compreso tra 45 = M − σ ≤ x ≤ M + σ = 55 è pari al 68,3%, come si evince dalle tavole redatte appositamente per il calcolo di questa probabilità. Formalmente la probabilità richiesta è data 24 dall’integrale P (45 ≤ x ≤ 50) = 55 ∫ 2 1 45 5 2π e − ( x−50) dx che, come noto, approssima la 50 " 100 %" 1 %k " 1 %100−k distribuzione binomiale P 45 ≤ k ≤ 50 = ∑ $ . '$ ' $ ' k &# 2 & # 2 & k=45 # 55 ( ) L’elaborazione dei dati e il grafico che seguono, sono stati realizzati con il foglio elettronico excel. p= 0,5 q= 0,5 n= 100 kmin= 45 kmax= 55 M= 50 5 k 45 46 47 48 49 50 51 52 53 54 55 6,14485E+28 7,3471E+28 8,44135E+28 9,32066E+28 9,89131E+28 1,00891E+29 9,89131E+28 9,32066E+28 8,44135E+28 7,3471E+28 6,14485E+28 45 46 47 48 49 50 51 52 53 54 55 0,048474297 0,057958398 0,0665905 0,07352701 0,078028664 0,079589237 0,078028664 0,07352701 0,0665905 0,057958398 0,048474297 0,048394145 0,057938311 0,066644921 0,073654028 0,078208539 0,079788456 0,078208539 0,073654028 0,066644921 0,057938311 0,048394145 25 Si noti come il grafico della funzione gaussiana, si adatta ai punti della distribuzione di Bernoulli. Esercizio Il politico dell’esercizio 3 vorrebbe sapere, su 1000 senatori, qual è la probabilità che almeno metà di questi accetti la proposta. • Applicare la distribuzione binomiale con questi numeri ( n =1000 ) è decisamente scomodo. Sfruttiamo le conclusioni dell’esercizio 3: x =1,25 su 5 diventa x = ( 1,25⋅1000 0,81⋅1000 = 250 , e σ = =162 . Di 5 5 2 x−250) ( 500 − ) P x ≥ 500 =1− conseguenza, ∫ −∞ 1 162 2π e 2⋅1622 dx = & . 500 − 250 ) P (z ≥ + =1− F 1,54 =1− 0,9382 = 0,0618 162 * ' ( ) Esercizi 1. Una società di autonoleggio, che dispone di un parco macchine di n = 900 unità, ha valutato in p = 0,2 la probabilità che un’auto, in un mese, richieda una riparazione. a) Qual è la probabilità che più di 200 auto richiedano in un determinato mese una riparazione? b) Qual è la probabilità che meno di 175 auto richiedano una riparazione in un determinato mese? 2. E’ noto che il 10% dei frigoriferi prodotti da una nota azienda è difettoso. In un determinato giorno, si scelgono casualmente n = 400 pezzi dall’intera produzione. a) Qual è la probabilità che almeno 35 frigoriferi siano difettosi? b) Qual è la probabilità che il numero di frigoriferi difettosi sia compreso tra 45 e 50? 3. S’intervista un campione casuale di 100 studenti di un Liceo per valutare il loro giudizio sulla trasparenza delle valutazioni delle prove somministrate. La domanda è secca: “le ritieni trasparenti oppure no?” Se il 60% degli intervistati ha ritenuto trasparenti le valutazioni delle prove, qual è la probabilità che meno del 50% del campione le ritenga tali? 26 4. La durata del battistrada di un marca di pneumatici è distribuita normalmente con media x = 35.000km e scarto quadratico medio σ = 4.000km . Si sceglie un campione casuale di n =100 pneumatici. Qual è la probabilità che più di 25 abbiano una durata superiore a 38.000 km? 5. L’amministratore di un condominio rileva che il 25% delle fatture risulta in arretrato di pagamento da almeno un mese. Si sceglie un campione casuale di 450 fatture. a) Qual è la probabilità che almeno 100 fatture risultino in arretrato da almeno un mese? b) Qual è la probabilità che il numero di fatture in arretrato da almeno un mese sia tra 120 e 150 ? Soluzioni Ricordiamo la modalità di lettura della funzione cumulativa # t ≥0 % F t P z<t =$ . % 1− F −t t < 0 & 1. La variabile aleatoria discreta X=”numero di auto che richiedono una riparazione in un determinato mese” presenta una distribuzione binomiale di probabilità. Visto l’alto numero di automobili ( n = 900 ), conviene approssimare la distribuzione binomiale con quella normale. Determiniamo innanzitutto il valore medio (atteso) di auto che richiedono una riparazione, x = np =180 , e deviazione standard ( () ( ) ) (scarto quadratico medio) σ = npq = 900 ⋅ 0,2⋅ 0,8 =12 . Con questi dati procediamo alla normalizzazione della variabile aleatoria al fine di x − x x −180 leggere le probabilità sulle tavole: z = . Risulta quindi: = σ 12 " 200 −180 % a)P x > 200 = P $ z > ' = P z >1,67 =1− F 1,67 =1− 0,9525 = 0,0475 12 # & ( ) ( ) ( ) " 175 −180 % P x <175 = P $ z < ' = P z < −0,42 =1− F (0,42) =1− 0,6628 = 0,3372 . 12 & # ( ) ( ) 2. La variabile aleatoria discreta X=”numero di frigoriferi difettosi” presenta una distribuzione binomiale di probabilità. Per l’approssimazione 27 con la distribuzione normale si procede come nell’esercizio precedente: x = np = 400 ⋅ 0,10 = 40 e σ = npq = 400 ⋅ 0,1⋅ 0,9 = 6 . " 35 − 40 % a)P ( x > 35) = P $ z > ' = P ( z > −0,83) = P ( z < 0,83) = F (0,83) = 0,7967 6 & # b)P (40 < x < 50) = P (0 < z <1,67) = F (1,67) − F (0,00) = 0,9525 − 0,5000 = 0,4525 3. La variabile aleatoria X=”numero di studenti che ritiene trasparenti le valutazioni” ha una distribuzione binomiale di probabilità con x = np =100 ⋅ 0,60 = 60 σ = npq = 100 ⋅ 0,6 ⋅ 0,4 = 4,90 : 2 − ( x−60) 2 ! n $ x n−x ! 100 $ x 100−x e 2⋅4,90 . Quindi p x =# ≈ &p q =# & 0,6 0,4 " x % " x % 4,90 2π " 50 − 60 % P x < 50 = P $ z < ' = P z < −2,04 =1− F 2,04 =1− 0,9793 = 0,0207 4,90 # & 4. In questo caso risulta " 38.000 − 35.000 % P z > 38.000 = P $ z > ' =1− F 0,75 = 0,2266 , e 4.000 # & questa probabilità dovrà essere utilizzata per il calcolo richiesto. Vediamo come. Risulta n = np =100 ⋅ 0,2266 = 22,66 come valore atteso della variabile aleatoria X=”numero di pneumatici del campione con durata maggiore di 38.000km”, con scarto quadratico medio σ = npq = 4,19 . La probabilità richiesta è quindi " 25 − 22,66 % P x > 25 = P $ z > ' = P z > 0,56 =1− F 0,56 = 0,2877 . 4,19 # & 5. X=”numero di fatture in arretrato da almeno un mese”. Risulta () ( ( )( ) ) ( ( ( ) ( ) ) ( ) p = 0,25 n = 450 ( x = np =112,5 ) ) ( ) , da cui segue: σ = npq = 9,19 " 100 −112,5 % a)P x <100 = P $ z < ' = P z < −1,36 =1− F 1,36 = 0,0869 9,19 # & "120 −112,5 150 −112,5 % b)P $ <z< ' = F 4,08 − F 0,82 = 0,2061 9,19 & # 9,19 ( ) ( ) ( ) ( ( ) ) 28 Approfondimento: calcolo del valor medio della distribuzione binomiale n n ! n $ k n−k n kn! p k q n−k n! p k q n−k x = ∑k # =∑ = poniamo &p q =∑ k! n − k ! k −1 ! n − k ! k % k=0 " k=1 k=1 ( ) ( )( ) ( ) k −1:= h ⇒ k = h +1 ⇒ h = 0,...,n −1 da cui segue n−1 n−1 n−1 # & h n−1−h n! p h+1q n−1−h (n −1)! p h q n−1−h n −1 x =∑ = np∑ = np∑% . L’ultima (p q h! n −1− h ! h! n −1− h ! h ' h=0 h=0 h=0 $ n ! $ k n−k n n sommatoria è lo sviluppo del binomio di Newton a + b = ∑# &a b ; nel k=0 " k % n−1 " % h n−1−h n−1 n −1 nostro caso quindi, ∑$ = p + q =1essendo p + q =1. Da 'p q h & h=0 # questo segue il risultato atteso: x = np . ( ) ( ) ( ) Approfondimento: calcolo del valor medio della distribuzione di Poisson ∞ ∞ k λ k−1 −λ λ −λ x = ∑ ke =λ e ∑ =λ e − λ e λ = λ , avendo utilizzato nell’ultima k! k=0 k=0 (k −1)! uguaglianza lo sviluppo in serie di Taylor della funzione esponenziale. Oppure, un altro modo per dedurre il valor medio è il seguente: ∞ ∞ k+1 λ k e−λ ∞ λ k+1 −λ λ −λ −λ λ 1= e e = e ∑ = ∑ k +1 k +1 ! ⇒ λ = ∑ k +1 e k +1 ! , dove k! λ k=0 k=0 k=0 ( ) ( ) ( ) ( ) nell’ultima espressione si riconosce la definizione generale di valore medio k+1 −λ λ di una variabile aleatoria discreta con probabilità pk+1 = e . k +1 ! ( ) 29