57-distribuzioni-di

1
CAPITOLO 7
DISTRIBUZIONI DI PROBABILITA’
Lo schema delle prove ripetute e i numeri di Pascal
Consideriamo il caso di un processo ricorrente, come il lancio ripetuto di una
moneta e chiediamoci: in quanti casi, su n lanci, esce testa m volte
(0 ≤ m ≤ n) ? Ad esempio, 3 volte su 4 lanci. Per questo scopo costruiamo il
seguente grafo.
1
n =1
1(t)
1(c)
n=2
1(tt)
2(tc)
1(cc)
n=3
1(ttt)
3(ttc)
3(tcc)
1(ccc)
n = 4 1(tttt)
4(tttc)
6(ttcc)
4(tccc)
1(cccc)
m=4
m=3
m=2
m =1
m=0
Si legge così: in colonna dall’alto verso il basso è indicato il numero di
lanci, n, mentre in orizzontale da sinistra verso destra, ad esempio, il
numero di successi, m. I numeri presenti in corrispondenza di ogni nodo
rappresentano il numero di cammini, corrispondente al totale degli esiti
favorevoli. Nel caso proposto, il nodo 4(tttc) dice che i modi in cui si
! 4 $
4!
= 4 . La
possono ottenere m = 3 teste in n = 4 lanci è #
&=
3!
4
−
3
!
" 3 %
(
probabilità che ciò accada è quindi
p(tttc) =
)
4 1
= = 0, 25 .
24 4
I numeri presenti in ogni nodo si chiamano numeri di Pascal, e lo
schema presentato si dice triangolo di Pascal. I numeri di Pascal si indicano
con il simbolo
! n $
#
&
" m %
ed hanno le due seguenti importanti proprietà:
! n $ n
&=2 ,
m=0 " m %
! n $ ! n −1 $ ! n −1 $
#
&=#
&+#
&.
" m % " m −1 % " m %
n
La somma per righe è pari al numero di casi possibili: ∑ #
La regola di formazione di ognuno è:
Lo schema delle prove ripetute funziona, ad esempio, anche nel caso del
lancio ripetuto di un dado. Per esempio, qual è la probabilità che su 7 lanci
esca il 4 esattamente 3 volte?
2
Applichiamo la regola di formazione per valutare il numero di casi del tipo
! 7 $
444xxxx , #
& = 35 ,
" 3 %
3
!1$ ! 5$
# & # &
"6% "6%
ognuno dei quali ha probabilità
che esca il 4 esattamente 3 volte in 7 lanci è quindi
4
. La probabilità
! 7 $! 1 $3 ! 5 $4
p(444xxxx) = #
&# & # & .
" 3 %" 6 % " 6 %
I numeri di Pascal e gli insiemi
Un’interessante applicazione dei numeri di Pascal è data dalla
determinazione del numero di sottoinsiemi di m elementi scelti da un insieme di n
! n $
#
& . Infatti, come
" m %
!
$
moneta, # n & rappresenta
" m %
elementi. Questo numero è proprio il numero di Pascal
abbiamo visto nel caso del lancio ripetuto di una
il numero di cammini che conducono, nel grafo, a quella determinata n-pla:
basta associare ad ognuno dei cammini uno degli insiemi che si possono
formare, e il gioco è fatto.
Variabili aleatorie discrete
Galileo Galilei fu interpellato circa il fatto che, nel gioco in cui si
lanciavano tre dadi e si puntava sulla somma dei numeri usciti, il 10
compariva più spesso del 9. Il grande scienziato studiò il problema, e lo
risolse nel suo scritto Considerazioni di Galileo sopra il gioco dei dadi.
Ciò che lasciava perplessi i giocatori che si rivolsero a Galileo, era che il
numero di terne utili a comporre la somma 10, ovvero 6, era uguale a
quello delle terne utili a comporre la somma 9.
Analizzando le terne in questione, Galileo osservò che il numero di modi in
cui si potevano presentare le singole terne era così distribuito:
10 : 631(6) 541(6)
9 : 621(6) 531(6)
532(6) 442(3) 433(3)
522(3) 441(3) 432(6)
622(3) = 27
333(1) = 25
I numeri a fianco delle terne sono i numeri di Pascal, che contano i modi
con cui la terna si può comporre. Se pensiamo che il numero di terne
possibili che si possono formare lanciando 3 dadi è 63 = 216 , allora lo scarto
tra le frequenze relative al 10 ed al 9 è 1 : è decisamente ragguardevole il
108
fatto che i due giocatori si siano accorti di questa differenza!
Analizziamo nel dettaglio il gioco di cui sopra. I valori possibili per le
somme vanno da 3 (111) a 18 (666). Chiamiamo variabile aleatoria (discreta) il
3
valore della somma su cui puntare, e lo indichiamo con X . Esaminiamo il
quadro generale, dove nella prima colonna è ripotato il valore della
variabile aleatoria, in quelle centrali sono riportate le terne favorevoli,
infine, nell’ultima colonna, sono riportati i valori della probabilità di
ciascuna variabile aleatoria.
X
terne
P(X )
3
111
1 / 216
4
121
3 / 216
5
113
122
6
114
123
222
7
115
124
133
8
116
125
134
224
233
21 / 216
9
126
135
144
234
252
333 25 /16
10
136
145
226
235
334
27 / 216
11 146
155
236
245 335 344
27 / 216
12
156
246
255
336
25 / 216
13 166
256
346
14
266
356
446
15
366
456
555
16
466
556
17
556
3 / 216
18
666
1 / 216
6 / 216
10 / 216
223
15 / 216
244
345
355
445
455
444
21 / 216
15 / 216
10 / 216
6 / 216
Con il concetto di variabile aleatoria è possibile estendere la definizione di
guadagno medio. Stabilito un determinato esperimento, si associa ad ogni
evento elementare la relativa probabilità, ed un certo numero variabile da
evento ad evento (la variabile aleatoria, appunto). Ad esempio,
nell’esperimento del lancio dei tre dadi, il valore della somma è la variabile
aleatoria, le terne che ne permettono l’uscita costituiscono l’evento, la
probabilità che associamo alla variabile aleatoria è il rapporto tra il
numero di terne favorevoli e quello di tutte le terne possibili.
Si definisce quindi valore medio della variabile aleatoria la somma dei prodotti
dei suoi valori per le rispettive probabilità.
Se X è una variabile aleatoria finita, che assume i valori x1,x2 ,...,x N , con
distribuzione di probabilità p1, p2 ,..., pN , si dice valore atteso di X o media il
numero reale:
N
x = ∑ xi pi .
i=1
4
Ad esempio, nel lancio dei tre dadi, il valore medio della somma è
X=
3⋅1+4⋅3+5⋅6+6⋅10+7⋅15+8⋅21+9⋅25+10⋅27+11⋅27+12⋅25+13⋅21+14⋅15+15⋅10+16⋅6+17⋅3+18⋅1
= 10, 5 .
216
Riportiamo i valori della variabile aleatoria su grafico ad istogramma.
X
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
numero(terne
1
3
6
10
15
21
25
27
27
25
21
15
10
6
3
1
216
P(X)
0,00462963
0,01388889
0,02777778
0,0462963
0,06944444
0,09722222
0,11574074
0,125
0,125
0,11574074
0,09722222
0,06944444
0,0462963
0,02777778
0,01388889
0,00462963
1
0,01388889
0,05555556
0,13888889
0,27777778
0,48611111
0,77777778
1,04166667
1,25
1,375
1,38888889
1,26388889
0,97222222
0,69444444
0,44444444
0,23611111
0,08333333
10,5
X = 10,5
30(
25(
20(
15(
10(
5(
0(
3(
4(
5(
6(
7(
8(
9(
10( 11( 12( 13( 14( 15( 16( 17( 18(
Varianza e deviazione standard di una variabile aleatoria
Nello studio della statistica descrittiva abbiamo già introdotto il concetto di
dispersione di una variabile statistica intorno alla sua media e abbiamo
introdotto una misura di questa dispersione introducendo i concetti di
varianza e di deviazione standard. Gli stessi concetti possono essere impiegati
nello studio delle variabili aleatorie. Pensiamo di rappresentare l'insieme
{x1,x2 ,...,x N } dei valori assunti da una variabile aleatoria X, sull'asse reale, e
di rappresentare anche il suo valore atteso x .
5
La varianza di X è definita come:
2
N
(
var(X ) = σ = ∑ x j − x
j=1
)
2
pj .
Essa rappresenta quindi la media ponderata dei quadrati delle distanze dai
valori assunti dalla X rispetto alla media della variabile aleatoria,
prendendo come pesi le probabilità della corrispondente distribuzione.
La varianza può anche essere vista come il valore medio della variabile
2
aleatoria ( X − x ) .
Osserviamo che la varianza è nulla solo a condizione che la X assuma un
solo valore con probabilità 1, cioè che sia costante.
La varianza costituisce una buona misura della dispersione di una variabile
aleatoria ed è additiva per le variabili indipendenti ma, come abbiamo già
osservato nello studio della statistica descrittiva, ha un difetto: non è
dimensionalmente omogenea alla variabile X. Per superare questo
inconveniente si considera lo scarto quadratico medio o deviazione standard,
definito come:
σ = var ( X ) .
La deviazione standard è meno agevole da utilizzare della varianza, poiché
non è additiva. Vedremo in seguito alcune applicazioni della varianza e
della deviazione standard.
Esempio
Nel lancio di due dadi non truccati, si calcoli il valore medio della variabile
aleatoria differenza in valore assoluto dei punteggi ottenuti.
X
p(x)
xp(x)
(
x−x
2
) p (x)
0
6/36
0
0,6301
1
10/36
10/36
0,2478
2
8/36
16/36
0,0007
3
6/36
18/36
0,1857
4
4/36
16/36
0,4695
5
2/36
m
10/36 35/18
0,5187 2,0525
6
Lo scarto quadratico medio è quindi σ ( X ) = var ( X ) = 2,0525 =1,43
.
Esempi
1. Si lanciano due dadi, uno regolare e l’altro truccato. In quest’ultimo
la probabilità che esca un numero pari è tripla di quella che esca un
numero dispari. Si confrontino i valori medi dei punteggi ottenuti
lanciando i due dadi.
• Nel caso del dado regolare il calcolo del valore medio del
punteggio è Xr = 1+ 2 + 3+ 4 + 5 + 6 = 3, 5 , mentre in quello del dado
6
truccato occorre determinare la probabilità 3p che esca un
numero pari, e che quella che esca un numero dispari, p . Dovrà
1
, di conseguenza
12
1
3
1
3
1
3
Xt = 1⋅ + 2 ⋅ + 3⋅ + 4 ⋅ + 5⋅ + 6 ⋅ = 3, 75 .
12
12
12
12
12
12
risultare
3⋅ 3p + 3⋅ p = 1 ⇒ p =
2. Nel lancio di due dadi non truccati, si calcoli il valore medio della
variabile aleatoria differenza in valore assoluto dei punteggi ottenuti.
•
X
p(x)
0
1
2
6/36 10/36 8/36
xp(x) 0
3
6/36
4
4/36
5
2/36
Valor
medio
10/36 16/36 18/36 16/36 10/36 35/18
3. Si lanciano contemporaneamente un dado e una moneta le cui facce
sono contrassegnate dai numeri 2 e 3. Si consideri la variabile
aleatoria X = “ differenza, in valore assoluto, tra il prodotto e la
somma dei numeri usciti “. Dopo aver rappresentato in modo
schematico i valori possibili, corredati delle rispettive probabilità, si
calcoli il valore medio della variabile aleatoria.
•
X
0
1
2
3
4
5
7
9
p(x)
1/12 4/12 1/12 2/12 1/12 1/12 1/12 1/12
xp(x)
0
4/12 2/12 6/12 4/12 5/12 7/12 9/12
7
Il valore medio della variabile aleatoria è ∑ XP(X) = 37 .
12
4. Si lanciano 5 volte due dadi regolari. Si consideri la variabile
aleatoria X = “numero di volte in cui il prodotto delle facce è ≥ 20 “.
Dopo aver rappresentato in modo schematico i valori possibili,
corredati delle rispettive probabilità, si calcoli il valore medio della
variabile aleatoria.
• La probabilità che il prodotto delle facce sia ≥ 20 è
# 5 &# 2 &k # 7 &5−k
2
7
p = ⇒ q = 1− p = ⇒ P ( X = k ) = %
(% ( % ( , k = 0,1, 2, 3, 4, 5 .
9
9
$ k '$ 9 ' $ 9 '
X
0
1
2
3
4
5
Xp(X)
0,284628021 0,406611458 0,232349405 0,066385544 0,009483649 0,000541923 0 0,406611458 0,464698809 0,199156633 0,037934597 0,002709614 1,111111111 (media)
F(X)
0,284628021 0,691239479 0,923588884 0,989974428 0,999458077
p(X)
1
Notiamo che nell’ultima riga è stata riportata la cosiddetta funzione di
ripartizione, ottenuta sommando progressivamente le probabilità relative ai
valori assunti dalla variabile aleatoria (teorema della somma delle probabilità).
DISTRIBUZIONI DI PROBABILTA’
Introduzione
Si ha una distribuzione di probabilità quando al valore assunto dalla variabile
aleatoria, viene associata la relativa probabilità. Indicata al solito con X la
variabile aleatoria, si definisce
funzione di ripartizione F ( x ) la probabilità che la variabile aleatoria
assuma un valore non superiore a x:
F x := p X ≤ x .
()
(
)
In generale,
F b − F a := p a ≤ X ≤ b .
()
()
(
)
Ricordiamo le definizioni di media e di varianza di una variabile aleatoria
discreta:
x := M X = ∑ xk pk
.
2
2
σ X = ∑ xk − x pk
( )
( )
(
)
Distribuzione binomiale o di Bernoulli
Consideriamo esperimenti, riguardanti variabili aleatorie discrete, che
possono dare due esiti, come ad esempio il lancio di una moneta, o
8
l’estrazione di una pallina da un’urna contenente palline di due soli colori.
Se p è la probabilità che un evento si verifichi, allora q =1− p è la
probabilità che l’evento non si verifichi.
Esempio. Un’urna contiene 25 palline, di cui 10 bianche e 15 nere.
Calcolare la probabilità che, su 5 estrazioni con reinserimento nell’urna
della pallina estratta:
1. Le prime tre palline siano bianche;
• Gli esiti favorevoli all’evento sono: BBBBB-BBBBN-BBBNBBBBNN. La probabilità si ottiene sommando la probabilità delle
cinquine individuate, in virtù dell’incompatibilità degli eventi:
5
4
!2$
!2$
+
2
# &
# &
"5%
"5%
3
!3$ !2$
# &+# &
"5% "5%
2
!3$
# & = 0,064 = 6,4% .
"5%
2. Soltanto le prime tre siano bianche
• Gli esiti favorevoli all’evento sono: BBBNN. La probabilità è
3
!2$
# &
"5%
2
!3$
# & = 0,02304 = 2,304%
"5%
3. Escano tre palline bianche;
• Il numero di esiti favorevoli all’evento è dato dalle combinazioni di 5
elementi presi a 3 per volta. La probabilità è quindi
! 5 $! 2 $3 ! 3 $2
#
&# & # & = 0,2304 = 23,04% .
3
"
%" 5 % " 5 %
Soffermiamoci sull’ultimo caso esaminato nell’esempio, e cerchiamo di
generalizzarlo. Possiamo affermare che la probabilità di conseguire
h successi (ognuno con probabilità p ) su n prove è data dalla relazione:
!
$
Ph = # n & p h q n−h
" h %
q =1− p
.
Si parla di distribuzione facendo riferimento allo studio di tutti i possibili esiti,
ovvero dei possibili valori che può assumere la variabile aleatoria discreta
riferita all’evento considerato.
Esempio. Si lancia 4 volte una moneta regolare, sempre nelle stesse
condizioni. Studiamo la variabile aleatoria “numero di volte che esce
testa”.
9
Riassumiamo nella seguente tabella le 5 possibilità:
0
X
1
0
p X
! 4 $! 1 $
#
&# &
" 0 %" 2 %
∑ p(X )
=
( )
( )
Xp X
1
16
0
4
!1$
# &
"2%
2
1
! 4 $! 1 $
#
&# &
" 1 %" 2 %
4
=
16
5
=
16
3
!1$
# &
"2%
4
16
3
2
! 4 $! 1 $
#
&# &
" 2 %" 2 %
6
=
16
11
=
16
2
!1$
# &
"2%
12
16
4
3
! 4 $! 1 $
#
&# &
" 3 %" 2 %
4
=
16
15
=
16
1
!1$
# &
"2%
12
16
! 4 $! 1 $4 ! 1 $0
#
&# & # &
" 4 %" 2 % " 2 %
1
=
16
16
= =1
16
4
16
Il valore medio della variabile aleatoria è x = ∑ xp ( x ) = 2 , mentre lo scarto
2
quadratico medio è σ = ∑( x − x ) p ( x ) =1 .
La distribuzione che abbiamo appena visto prende il nome del matematico
J. Bernoulli (1654-1705), considerato tra i fondatori del moderno calcolo
delle probabilità, autore dell’opera, pubblicata postuma nel 1713, Ars
conjectandi.
Osserviamo i seguenti fatti, relativi alla distribuzione di Bernoulli, facendo
riferimento all’esempio trattato.
1. Simmetria della distribuzione: la probabilità che esca h volte testa è
uguale a quella che esca n − h volte croce. Questa proprietà vale
1
2
soltanto nel caso particolare p = q = .
2. Condizione di normalizzazione: la somma delle probabilità è uguale a 1.
Questa probabilità vale sempre, per l’incompatibilità degli eventi.
3. In genere, la probabilità che la variabile aleatoria assuma un qualsiasi
valore è abbastanza bassa. Questo fatto è conseguenza di un numero
di prove abbastanza elevato.
4. Il valore della variabile aleatoria che presenta la massima probabilità
è
n
n
n +1
se n è pari, la parte intera di oppure
se n è dispari.
2
2
2
5. La media della distribuzione binomiale è x = np .
6. Lo scarto quadratico medio della distribuzione binomiale è σ = npq .
10
Esercizi
1. Lanciare un dado 4 volte e considerare la variabile aleatoria
X = ”numero di volte che esce il 3”. Redigere la tabella delle
probabilità completa della righe della funzione di ripartizione, e di
quelle necessarie per il calcolo del valor medio della variabile
aleatoria e della deviazione standard (scarto quadratico medio).
0
X
0
p X
! 4 $! 1 $
##
&&# &
" 0 %" 6 %
625
=
1296
∑ p(X )
=
( )
( )
Xp X
1
1
4
! 4 $! 1 $
#
&# &
" 1 %" 6 %
500
=
1296
!5$
# &
"6%
625
1296
2
3
2
!5$
# &
"6%
! 4 $! 1 $
##
&&# &
" 2 %" 6 %
150
=
1296
1125
1296
500
1296
3
! 4 $! 1 $
##
&&# &
" 3 %" 6 %
20
=
1296
!5$
# &
"6%
1275
1296
300
1296
=
0
3
2
4
! 4 $! 1 $4 ! 5 $0
#
&# & # &
" 4 %" 6 % " 6 %
1
=
1296
1
!5$
# &
"6%
1295
1296
60
1296
=
1296
=1
1296
4
1296
=
=
• Il numero medio di uscite del “3” è quindi x = ∑ xp ( x ) =
864
= 0,67 ,
1296
2
mentre lo scarto quadratico medio è σ = ∑( x − x ) p ( x ) = 0,56 .
2. A 4 giorni dalla data di effettuazione di un volo, una compagnia
aerea constata che sono rimasti 16 posti liberi, e sa che l’80% di
coloro che acquistano il biglietto partono effettivamente. Qual è la
probabilità di overbooking?
# 20 &
• p 17 ≤ k ≤ 20 = ∑ p x = ∑ %%
(( 0,80
k
$
'
k=17
k=17
20
(
)
20
()
(
k
) (0,20)
20−k
= 0,411 .
3. Un politico stima che il 25% dei senatori appoggerà una sua
proposta di legge. Qual è la probabilità che almeno un senatore su 5
scelti a caso appoggi la proposta? Qual è la probabilità di ottenere
l’appoggio dalla maggioranza dei senatori?
0
1
2
3
4
5
X
0,2373
0,3955
0,2637
0,0879
0,0146
0,0010
p (x)
∑ p (x)
0,2373
0,6328
0,8965
0,9844
0,999
1
()
0
0,3955
0,5274
0,2637
0,0584
0,005
0,3708
0,0247
0,0165
0,2692
0,1104
0,0141
xp x
(
x−x
2
) ()
p x
11
• Il numero medio di senatori disposti ad appoggiare la proposta di
legge è quindi x = ∑ xp ( x ) =1,25 , con uno scarto quadratico medio è
2
σ = ∑( x − x ) p ( x ) = 0,81. p ( x ≥1) =1− p (0) = 0,7627 ,
p x ≥ 3 = 0,0879 + 0,0146 + 0,001= 0,1035 .
(
)
Distribuzione di Poisson
Consideriamo il caso del decadimento di un campione radioattivo, e
domandiamoci: “quanti decadimenti dovremmo aspettarci ( k ) ogni
ΔT minuti se il campione è costituito da n nuclei?”
Viene piuttosto naturale inquadrare il problema nell’ambito della
distribuzione binomiale. Infatti, se p è la probabilità che ha ogni nucleo di
decadere, allora la probabilità che si verifichino k decadimenti in
!
$
n−k
ΔT minuti è # n & p k 1− p .
" k %
C’è un problema non di poco conto: la dimensione del campione (di solito
n ≈ 1020 ) e il valore della probabilità di successo ( p ≈ 10−20 ). Con questi
ordini di grandezza, la distribuzione binomiale può essere approssimata
con una funzione più semplice, detta distribuzione di Poisson, che esprime la
probabilità di osservare k decadimenti in un intervallo di tempo fissato
ΔT :
k
! n $ k
n−k
−λ λ
≈e
,
#
& p 1− p
k
!
" k %
dove λ è il numero medio di eventi (decadimenti) per intervallo di tempo.
Infatti:
k
n−k
k
n−k
# n & k n−k
n! # λ & # λ &
n(n −1) ⋅...⋅ (n − k +1) # λ & # λ &
lim %
( p q = lim
% ( %1− ( = lim
% ( %1− ( =
n→∞
n→∞ k !(n − k)! n
n→∞
n
k
!
k
$ ' $
'
$n' $ n'
$
'
(
)
(
)
−λ
n
+
− .
−k
k #
λ
n(n −1) ⋅...⋅ (n − k +1) λ λ& 0 # λ&
λ k −λ
lim
%1− (
%1− ( = e
n→∞
k ! -$ n ' 0 $ n '
k!
nk
-,
0/
In definitiva, possiamo dimostrare le seguenti proprietà della distribuzione
di Poisson:
12
1. La media della distribuzione di Poisson è x = λ .
2. Lo scarto quadratico medio della distribuzione Poisson è σ = λ .
Esperimento (particolarmente indicato per studenti del Liceo
Castelnuovo di Firenze!)
Scegliamo un’ora “di punta”, ad esempio dalle 12:00 alle 13:00, di un
giorno feriale, e posizioniamoci in corrispondenza del semaforo posto
all’incrocio tra viale Matteotti e via La Marmora. L’esperimento è il
seguente: si contano i veicoli a motore che transitano tra due luci verdi del
semaforo consecutive, e tra questi quelli che girano a destra in via La
Marmora. Lo scopo dell’esperimento è quello di verificare se ci troviamo
in presenza di una distribuzione di Poisson. Infatti, la scelta dell’ora di
punta va incontro alla richiesta di “campione numeroso” (le automobili
che passano tra due verdi consecutivi) e la scelta dell’incrocio a quella in
cui la probabilità che l’evento accada è bassa (trattandosi via La Marmora
di corsia “preferenziale”, le automobili che girano a destra dovrebbero
essere poche). Staranno veramente così le cose?
Esercizio
In un famoso esperimento, Rutherford insieme ad altri fisici, contò il
numero delle particelle α emesse da una pellicola di polonio. Furono
considerati 2608 intervalli di tempo successivi ottenendo i seguenti
risultati :
Numero di
particelle
0
Frequenza
57
1
2
3
4
5
6
7
203 383 525 532 408 273 139
8
9
10
45
27
16
Qual è il numero medio di particelle α emesse in un intervallo di
tempo? Qual è la probabilità che il numero delle particelle emesse in
dato intervallo di tempo siano più di 4?
•
x = 3,9
p(x > 4) =1− "# p(0) + p(1) + p(2) + p(3) + p(4)$% = 0,35 .
13
x
f(x)
0
1
2
3
4
5
6
7
8
9
10
57
203
383
525
532
408
273
139
45
27
16
p(x)
0,021855828
0,077837423
0,146855828
0,201303681
0,20398773
0,156441718
0,104677914
0,053297546
0,017254601
0,010352761
0,006134969
1
prob.Poisson
0,020914109
0,080881787
0,156398333
0,201614722
0,194927731
0,150770022
0,097179604
0,053689389
0,025954332
0,011152667
0,004313106
F(x)
0,021855828
0,099693252
0,24654908
0,447852761
0,651840491
0,808282209
0,912960123
0,966257669
0,98351227
0,993865031
1
xp(x)
0
0,077837423
0,293711656
0,603911043
0,81595092
0,782208589
0,628067485
0,373082822
0,13803681
0,093174847
0,061349693
3,867331288
valormedio
(x-xmedio)^2p(x)
0,326881259
0,639947281
0,512075426
0,151433424
0,003590385
0,200705089
0,476104027
0,523041504
0,294690483
0,272736112
0,230733899
1,905764647
deviazione
standard
L’istogramma blu rappresenta la probabilità calcolata con i rilevamenti
effettivi del numero di particelle emesse, mentre quello in rosso la
distribuzione di probabilità di Poisson.
Esercizi
1. I clienti di un supermercato arrivano alla cassa al ritmo medio di tre
al minuto. Si calcoli la probabilità che in un dato minuto avvengano
al massimo due arrivi, nell’ipotesi che questi seguano una
distribuzione di Poisson.
2. La media d’infortuni in una fabbrica segue la distribuzione di Poisson
con media mensile 2,6. a) Qual è la probabilità che in mese gli
14
infortuni siano meno di due? b) Qual è invece la probabilità che,
sempre in un dato mese, gli infortuni siano più di tre?
3. Nel periodo seguente la consegna dell’ormai leggendario pagellino, la
segreteria della scuola riceve 4,2 e-mail in media, al giorno, da parte
dei genitori degli studenti. Se queste seguono una distribuzione di
Poisson, qual è la probabilità di riceverne almeno tre?
4. Un’importante azienda agricola possiede 250 trattori. La probabilità
che uno di questi, in una determinata settimana, richieda un
intervento meccanico è 0,01. Si trovi la probabilità che, in una data
settimana, meno di 4 trattori richiedano un intervento meccanico. Si
approssimi la distribuzione binomiale con quella di Poisson.
5. Una compagnia di assicurazioni stipula 6.000 polizze. La probabilità
che, in un anno, il titolare di una polizza richieda un indennizzo è
0,001. Si calcoli la probabilità che, in quell’anno vengano presentate
almeno tre richieste d’indennizzo. Si approssimi la distribuzione
binomiale con quella di Poisson.
6. In uno Stato dell’Unione l’assicurazione di responsabilità civile per i
ciclisti è obbligatoria per legge. Nonostante ciò, il 7,5% dei ciclisti
non la possiede. Scelto un campione casuale di 60 ciclisti, si calcoli la
probabilità che almeno 3 di questi non sia assicurato.
Soluzioni
()
1. p k = e
−x
0
1
2
xk
−3 3
−3 3
−3 3
⇒ p x ≤2 =e
+e
+e
= 0,4232 .
k!
0!
1!
2!
(
)
()
2. X= numero d’infortuni in un mese, x = 2,6 ⇒ p k = e −2,6
( )
p ( x > 3) =1− p(0) − p(1) − p(2) − p(3) = 0,2640 .
p x < 2 = p(0) + p(1) = 0,2674 , b)
( )
2,6
k!
k
. Quindi a)
15
()
3. X= numero di e-mail ricevute dalla segreteria, x = 4,2 ⇒ p k = e −4,2
(
( )
4,2
k
k!
.
)
p x ≥ 3 =1− p(0) − p(1) − p(2) = 0,7898 .
4. X= numero di guasti che si verificano su una tangenziale ogni giorno,
()
( )
3,2
k
(
)
; a) p x < 2 = p(0) + p(1) = 0,1712 , b)
k!
p x > 4 =1− p(0) − p(1) − p(2) − p(3) − p(4) = 0,2194 .
x = 3,2 ⇒ p k = e −3,2
(
)
5. X= numero di richieste d’indennizzo in un anno; se la probabilità che un
assicurato richieda un indennizzo è p = 0,001, il valore atteso di
richieste in un anno è x = np = 6.000 ⋅ 0,001= 6 , per cui
k
! 6.000 $
k
6.000−k
−6 6
. Di conseguenza,
p k =#
≈e
& 0,001 0,999
k!
k
"
%
()
(
(
)(
)
)
p x ≥ 3 =1− p(0) − p(1) − p(2) = 0,9380 .
6. X= numero di ciclisti non assicurati; se la probabilità che un ciclista non
sia assicurato è p = 0,075 , il valore atteso di richieste in un anno è
x = np = 60 ⋅ 0,075 = 4,5 , per cui
k
! 60 $
k
60−k
−4,5 4,5
. Di conseguenza,
p k =#
≈e
& 0,075 0,925
k!
" k %
()
(
(
)(
)
)
p x ≥ 3 =1− p(0) − p(1) − p(2) = 0,8264 .
Variabili aleatorie continue
Decisamente interessante è il caso rappresentato dalle variabili aleatorie
continue; in tal caso, se la funzione di ripartizione1 è derivabile, la sua derivata si
dice funzione di densità
()
()
F! x = f x ,
1Ricordiamo che la funzione di ripartizione di una variabile aleatoria X esprime la probabilità che
questa non superi un determinato valore
( )
(
x0 : F x0 = P X ≤ x0
)
−∞ < x0 < +∞
.
16
()
ed il termine f x dx rappresenta approssimativamente la probabilità che
la variabile aleatoria assuma un valore compreso in un intervallo
infinitesimo di ampiezza dx contenente il valore X = x .
Riepiloghiamo quanto detto finora nel seguente schema comparativo tra le
variabili aleatorie discrete e continue.
variabili aleatorie discrete
x = ∑ xk pk
σ=
∑(
)
variabili aleatorie continue
+∞
x=
∫ xf ( x ) dx
−∞
2
+∞
xk − x pk
σ=
∫(
x−x
−∞
∑p
k
2
) f ( x ) dx +∞
=1
∫ f ( x ) dx =1
−∞
Distribuzione uniforme
Si ha una distribuzione uniforme quando è attribuita la stessa probabilità
ad ogni elemento dell’insieme su cui è definita. Ad esempio, nel lancio di
un dado equilibrato, ogni faccia ha probabilità
1
di uscire.
6
Una variabile aleatoria continua ( a ≤ X ≤ b) ha una distribuzione uniforme se
ha una funzione di ripartizione così definita:
#
0
%
F x =$ x−a b−a
%
1
&
()
(
)(
)
se
x≤a
se a < x ≤ b
se
x>b
La funzione densità è
#
0
%
f x =$ 1 b−a
%
0
&
()
(
)
se
x≤a
se a < x ≤ b .
se
x>b
.
17
Osserviamo, innanzi tutto, che
b
+∞
∫ ()
f x dx =
a
−∞
x=
2
+∞
b
−∞
a
∫ xf ( x ) dx = ∫
σ =
+∞
2
(
3
)
(
)
)
2
b
$ a +b' 1
f x dx = ∫ & x −
dx =
)
2
b
−
a
(
a %
(
3
(
)
)
.
3
$b−a' $a −b'
$b−a'
−
2
&
) &
)
&
)
b−a
% 2 ( % 2 (
% 2 (
=
=
12
3 b−a
3 b−a
(
(
1
b−a
dx =
=1 . Inoltre si ha
b−a
b−a
x
b2 − a 2 a + b
dx =
=
,e
2
b−a
2 b−a
∫ (x − x ) ( )
−∞
∫
(
)
2
)
Esempio
Una cisterna della capienza di 1000 litri viene riempita ogni mattina,
prima dell’apertura della stazione di servizio. Qual è la probabilità di
vendere tra 0 e 400 litri di carburante?
• Consideriamo la variabile aleatoria X=”numero di litri venduti in un
determinato giorno”. La probabilità della variabile aleatoria è distribuita
uniformemente perché ogni quantità di carburante x tale che
0l ≤ x ≤1000l ha la stessa probabilità di essere venduta. Di
conseguenza, la probabilità di vendere x litri di carburante (ovvero
1
che la variabile aleatoria X assuma il valore x) è P X = x =
. La
1000
#
0
x<0
%
% x−0
funzione di ripartizione è quindi F x = $
0 ≤ x ≤1000 .
% 1000 − 0
%&
1
x >1000
(
()
In particolare, la probabilità richiesta è
400
1
400
P x ≤ 400 = ∫
dx = F 400 =
= 0,4 = 40% .
1000
−∞ 1000
(
)
( )
)
18
Problema
La probabilità che si verifichi un guasto in un punto qualsiasi di una
conduttura lunga 2 km è 0,5. Scrivere la densità di probabilità, la funzione
di ripartizione, e si calcoli la probabilità che si verifichi un guasto tra il km
1,5 ed il km 2 della conduttura.
• In questo caso la variabile aleatoria è X=”si verifica un guasto al km
x
"$ 0,5 0 ≤ x ≤ 2
x
x”. f x = #
, F x = ∫ 0,5dt = ,
2
$% 0
altrove
−∞
()
()
(
)
() ( )
P 1,5 ≤ x ≤ 2 = F 2 − F 1,5 =1− 0,75 = 0,25 = 25% .
Esercizio
a) Si dica per quale valore del parametro A, la funzione
#%
0;
x<0
rappresenta una densità di probabilità.
g n (x) = $
n −x
%& Ax e ; x ≥ 0
• Per la condizione di normalizzazione: 1=
+∞
n −x
∫ Ax e
dx = An! ⇒ A =
0
1
.
n!
b) Si calcolino il valore medio e la deviazione standard della variabile casuale
# 0;
x<0
%
continua la cui densità di probabilità è g2 (x) = $ x 2e −x
.
;
x
≥
0
%
& 2
(x e ) dx = lim F (x) = 3! = 3 , mentre la
Il valor medio è x = ∫ x
+∞
•
0
2 −x
x→+∞ 3
2
2
deviazione standard è data dalla relazione σ x
(x e ) dx = 3 .
= ∫ (x − 3)
+∞
2 −x
2
0
2
La distribuzione normale in Fisica. Un’introduzione al Metodo
Statistico
Supponiamo di aver misurato N volte una grandezza fisica x, e che le
misure siano affette soltanto da errori accidentali. La miglior stima del valore
N
della grandezza è il valor medio x =
∑x
k=i
N
i
. Un indice di variabilità
19
comunemente utilizzato a corredo del valor medio è lo scarto quadratico
N
medio, o deviazione standard, definito come σ x =
∑(
xi − x
i=1
)
2
N
.
Esempio. Sono stati misurati il diametro e la circonferenza di 40 oggetti
circolari diversi, al fine di valutare π .
Riportiamo i risultati in tabella e facciamo alcune considerazioni.
π xk
3,08
3,10
3,11
3,12
3,13
3,14
3,15
3,16
3,17
3,18
3,20
occorrenze
5
3
2
2
10
5
9
1
1
1
1
0,05
0,25
0,125 0,225 0,025 0,025 0,025 0,025
nk
frequenze
fk =
0,125 0,075 0,05
nk
N
Quando il numero di dati da trattare è grande e presenta risultati ripetuti
(ad esempio il valore calcolato 3,13 è presente 10 volte!) il calcolo della
media viene eseguito introducendo il concetto di frequenza: f k =
nk
, dove
N
nk indica quante volte è presente il valore xk nella distribuzione (quelle che
n
nella tabella sono state riportate come occorrenze); ovviamente,
∑n
k
=N
k=1
essendo n i valori distinti xk (nel nostro caso quindi, N = 40 , n =11).
Il valore medio e la deviazione standard in termini di frequenze sono
rispettivamente:
n
x = ∑ xk f k = 3,1305 , σ x =
k=1
n
∑( x
k=1
−x
k
)
2
f k = 8 ⋅10−4 .
Nel caso in esame (in genere nella misura di grandezze fisiche) si ha un
intervallo continuo di valori possibili, e la rappresentazione delle frequenze
mediante istogrammi ad intervalli è particolarmente indicata.
20
Quando N è grande, si nota che il diagramma che rappresenta la
distribuzione delle frequenze per ciascuna misura (o raggruppamento di misure,
come nell’istogramma sopra) può essere approssimato con una curva
continua detta distribuzione limite. Nel caso di misure affette soltanto da errori
casuali, la distribuzione limite è rappresentata dalla cosiddetta curva normale
(o di Gauss), la cui espressione analitica è la seguente:
2
()
f x =
1
σ 2π
e
−
( x−x )
2σ 2
,
ed il grafico, con la caratteristica forma a campana, è rappresentato sotto.
In buona sostanza, con la distribuzione limite passiamo dalla coppia
valore-frequenza ( xk , f k ) al punto x, f ( x ) . Se poniamo uguale a uno
(
)
l’ampiezza della base dei rettangoli che compongono l’istogramma,
possiamo dire che l’area di questo è la somma delle frequenze:
∑ fk = ∑
nk N
= =1. Questa caratteristica si trova in forma di integrale nella
N N
2
funzione di Gauss:
+∞
∫
−∞
1
σ 2π
e
−
( x−x )
2σ 2
dx =1 . Per dimostrare questa importante
21
+∞
proprietà sfruttiamo il risultato
∫e
−x 2
dx = π . Posto z =
−∞
Di conseguenza,
x−x
σ 2
⇒ dx = σ 2dz .
2
+∞
∫
−∞
1
σ 2π
e
−
( x−x )
2σ 2
1
+∞
dx =
∫
−∞
−z2
σ 2π
e σ 2dz =
1
+∞
π
∫e
−z2
dz =
−∞
π
π
=1 .
2
Il termine
1
e
−
( x−x )
2σ 2
dx rappresenta quindi la frazione di misure comprese tra
σ 2π
x e x + dx , che equivale alla probabilità che una misura dia un risultato
compreso tra x e x + dx .
Nelle applicazioni si ricorre spesso alla distribuzione normale standardizzata,
ottenuta mediante la sostituzione formale z =
l’espressione
y=
1
2π
e
−
z2
2
x−x
, da cui segue
σ
−∞ < z < +∞ ,
nota come funzione degli errori.
In particolare, la probabilità che una misura differisca per t deviazioni
standard dalla media è data dalla
2
relazione P ( x − tσ < x < x + tσ ) =
x +tσ
∫
1
e
( x−x )
−
2σ 2
(
()
(
t
) ∫
F z =P z<t =
−∞
e
z2
2
2π
−t
e
z2
2
2π
dz .
dz per valori di t ≥ 0 la cui lettura avviene con la
#
% F t
seguente modalità: P z < t = $
% 1− F −t
&
(
) ∫
dx = P −t < z < t =
x −tσ σ 2π
Nelle tavole sono di solito tabulati i valori della funzione
−
t
−
)
()
( )
t ≥0
t <0
.
Riportiamo di seguito le conclusioni del celebre problema proposto a
Galileo Galilei, in cui si riassume lo studio della variabile aleatoria discreta
“X = somma delle facce nel lancio di 3 dadi”.
22
Il valore medio della somma è
X=
3⋅1+4⋅3+5⋅6+6⋅10+7⋅15+8⋅21+9⋅25+10⋅27+11⋅27+12⋅25+13⋅21+14⋅15+15⋅10+16⋅6+17⋅3+18⋅1
= 10, 5 .
216
Riportiamo i valori della variabile aleatoria su grafico ad istogramma.
X
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
numero(terne
1
3
6
10
15
21
25
27
27
25
21
15
10
6
3
1
216
P(X)
0,00462963
0,01388889
0,02777778
0,0462963
0,06944444
0,09722222
0,11574074
0,125
0,125
0,11574074
0,09722222
0,06944444
0,0462963
0,02777778
0,01388889
0,00462963
1
0,01388889
0,05555556
0,13888889
0,27777778
0,48611111
0,77777778
1,04166667
1,25
1,375
1,38888889
1,26388889
0,97222222
0,69444444
0,44444444
0,23611111
0,08333333
10,5
X = 10,5
30(
25(
20(
15(
10(
5(
0(
3(
4(
5(
6(
7(
8(
9(
10( 11( 12( 13( 14( 15( 16( 17( 18(
Dal grafico sopra sembra esserci una somiglianza tra la distribuzione delle
probabilità della variabile aleatoria discreta (binomiale) e la funzione di
Gauss.
Distribuzione Normale come approssimazione di quella
binomiale
Quando il numero di prove è molto grande, la distribuzione binomiale può
essere approssimata da una funzione, la nota curva a campana (o, più
semplicemente, campana) di Gauss:
23
2
()
f x =
1
σ 2π
e
−
( x−x )
2σ 2
,
dove con x = np e σ = npq si sono indicati rispettivamente la media e lo
scarto quadratico medio della distribuzione.
Esempio. Lanciamo 100 volte una moneta: la distribuzione binomiale è
1
approssimata dalla distribuzione normale di media x = np =100 ⋅ = 50 , e
2
1 1
2 2
scarto quadratico medio σ = npq = 100 ⋅ ⋅ = 5 ; I grafici che seguono
sono stati realizzati con il foglio elettronico excel.
Interpretazione dei risultati
2
L’equazione della curva normale è f ( x ) =
1
5 2π
e
−
( x−50)
50
. La probabilità
che esca testa un numero di volte compreso tra 45 = M − σ ≤ x ≤ M + σ = 55 è
pari al 68,3%, come si evince dalle tavole redatte appositamente per il
calcolo di questa probabilità. Formalmente la probabilità richiesta è data
24
dall’integrale P (45 ≤ x ≤ 50) =
55
∫
2
1
45 5 2π
e
−
( x−50)
dx che, come noto, approssima la
50
" 100 %" 1 %k " 1 %100−k
distribuzione binomiale P 45 ≤ k ≤ 50 = ∑ $
.
'$ ' $ '
k &# 2 & # 2 &
k=45 #
55
(
)
L’elaborazione dei dati e il grafico che seguono, sono stati realizzati con il
foglio elettronico excel.
p= 0,5
q= 0,5
n= 100
kmin= 45
kmax= 55
M= 50
5
k
45
46
47
48
49
50
51
52
53
54
55
6,14485E+28 7,3471E+28
8,44135E+28
9,32066E+28
9,89131E+28
1,00891E+29
9,89131E+28
9,32066E+28
8,44135E+28
7,3471E+28
6,14485E+28
45 46
47
48
49
50
51
52
53
54
55
0,048474297
0,057958398
0,0665905
0,07352701
0,078028664
0,079589237
0,078028664
0,07352701
0,0665905
0,057958398
0,048474297
0,048394145
0,057938311
0,066644921
0,073654028
0,078208539
0,079788456
0,078208539
0,073654028
0,066644921
0,057938311
0,048394145
25
Si noti come il grafico della funzione gaussiana, si adatta ai punti della
distribuzione di Bernoulli.
Esercizio
Il politico dell’esercizio 3 vorrebbe sapere, su 1000 senatori, qual è la
probabilità che almeno metà di questi accetti la proposta.
• Applicare la distribuzione binomiale con questi numeri ( n =1000 ) è
decisamente scomodo. Sfruttiamo le conclusioni dell’esercizio 3:
x =1,25 su 5 diventa x =
(
1,25⋅1000
0,81⋅1000
= 250 , e σ =
=162 . Di
5
5
2
x−250)
(
500
−
)
P x ≥ 500 =1−
conseguenza,
∫
−∞
1
162 2π
e
2⋅1622
dx =
&
.
500 − 250 )
P (z ≥
+ =1− F 1,54 =1− 0,9382 = 0,0618
162 *
'
(
)
Esercizi
1. Una società di autonoleggio, che dispone di un parco macchine di
n = 900 unità, ha valutato in p = 0,2 la probabilità che un’auto, in un
mese, richieda una riparazione. a) Qual è la probabilità che più di
200 auto richiedano in un determinato mese una riparazione? b)
Qual è la probabilità che meno di 175 auto richiedano una
riparazione in un determinato mese?
2. E’ noto che il 10% dei frigoriferi prodotti da una nota azienda è
difettoso. In un determinato giorno, si scelgono casualmente n = 400
pezzi dall’intera produzione. a) Qual è la probabilità che almeno 35
frigoriferi siano difettosi? b) Qual è la probabilità che il numero di
frigoriferi difettosi sia compreso tra 45 e 50?
3. S’intervista un campione casuale di 100 studenti di un Liceo per
valutare il loro giudizio sulla trasparenza delle valutazioni delle prove
somministrate. La domanda è secca: “le ritieni trasparenti oppure
no?” Se il 60% degli intervistati ha ritenuto trasparenti le valutazioni
delle prove, qual è la probabilità che meno del 50% del campione le
ritenga tali?
26
4. La durata del battistrada di un marca di pneumatici è distribuita
normalmente con media x = 35.000km e scarto quadratico medio
σ = 4.000km . Si sceglie un campione casuale di n =100 pneumatici.
Qual è la probabilità che più di 25 abbiano una durata superiore a
38.000 km?
5. L’amministratore di un condominio rileva che il 25% delle fatture
risulta in arretrato di pagamento da almeno un mese. Si sceglie un
campione casuale di 450 fatture. a) Qual è la probabilità che almeno
100 fatture risultino in arretrato da almeno un mese? b) Qual è la
probabilità che il numero di fatture in arretrato da almeno un mese
sia tra 120 e 150 ?
Soluzioni
Ricordiamo la modalità di lettura della funzione cumulativa
#
t ≥0
% F t
P z<t =$
.
% 1− F −t t < 0
&
1. La variabile aleatoria discreta X=”numero di auto che richiedono una
riparazione in un determinato mese” presenta una distribuzione binomiale
di probabilità. Visto l’alto numero di automobili ( n = 900 ), conviene
approssimare la distribuzione binomiale con quella normale.
Determiniamo innanzitutto il valore medio (atteso) di auto che
richiedono una riparazione, x = np =180 , e deviazione standard
(
()
( )
)
(scarto quadratico medio) σ = npq = 900 ⋅ 0,2⋅ 0,8 =12 . Con questi
dati procediamo alla normalizzazione della variabile aleatoria al fine di
x − x x −180
leggere le probabilità sulle tavole: z =
. Risulta quindi:
=
σ
12
"
200 −180 %
a)P x > 200 = P $ z >
' = P z >1,67 =1− F 1,67 =1− 0,9525 = 0,0475
12
#
&
(
)
(
)
( )
" 175 −180 %
P x <175 = P $ z <
' = P z < −0,42 =1− F (0,42) =1− 0,6628 = 0,3372 .
12 &
#
(
)
(
)
2. La variabile aleatoria discreta X=”numero di frigoriferi difettosi” presenta
una distribuzione binomiale di probabilità. Per l’approssimazione
27
con la distribuzione normale si procede come nell’esercizio
precedente: x = np = 400 ⋅ 0,10 = 40 e σ = npq = 400 ⋅ 0,1⋅ 0,9 = 6 .
"
35 − 40 %
a)P ( x > 35) = P $ z >
' = P ( z > −0,83) = P ( z < 0,83) = F (0,83) = 0,7967
6 &
#
b)P (40 < x < 50) = P (0 < z <1,67) = F (1,67) − F (0,00) = 0,9525 − 0,5000 = 0,4525
3. La variabile aleatoria X=”numero di studenti che ritiene trasparenti le
valutazioni” ha una distribuzione binomiale di probabilità con
x = np =100 ⋅ 0,60 = 60 σ = npq = 100 ⋅ 0,6 ⋅ 0,4 = 4,90 :
2
−
( x−60)
2
! n $ x n−x ! 100 $
x
100−x
e 2⋅4,90
. Quindi
p x =#
≈
&p q =#
& 0,6 0,4
" x %
" x %
4,90 2π
"
50 − 60 %
P x < 50 = P $ z <
' = P z < −2,04 =1− F 2,04 =1− 0,9793 = 0,0207
4,90
#
&
4. In questo caso risulta
"
38.000 − 35.000 %
P z > 38.000 = P $ z >
' =1− F 0,75 = 0,2266 , e
4.000
#
&
questa probabilità dovrà essere utilizzata per il calcolo richiesto.
Vediamo come. Risulta n = np =100 ⋅ 0,2266 = 22,66 come valore
atteso della variabile aleatoria X=”numero di pneumatici del campione con
durata maggiore di 38.000km”, con scarto quadratico medio
σ = npq = 4,19 . La probabilità richiesta è quindi
"
25 − 22,66 %
P x > 25 = P $ z >
' = P z > 0,56 =1− F 0,56 = 0,2877 .
4,19
#
&
5.
X=”numero di fatture in arretrato da almeno un mese”. Risulta
()
(
( )( )
)
(
(
(
)
(
)
)
(
)
p = 0,25 n = 450
(
x = np =112,5
)
)
(
)
, da cui segue:
σ = npq = 9,19
" 100 −112,5 %
a)P x <100 = P $ z <
' = P z < −1,36 =1− F 1,36 = 0,0869
9,19
#
&
"120 −112,5
150 −112,5 %
b)P $
<z<
' = F 4,08 − F 0,82 = 0,2061
9,19 &
# 9,19
(
)
(
)
(
) (
( )
)
28
Approfondimento: calcolo del valor medio della distribuzione
binomiale
n
n
! n $ k n−k n kn! p k q n−k
n! p k q n−k
x = ∑k #
=∑
= poniamo
&p q =∑
k!
n
−
k
!
k
−1
!
n
−
k
!
k
%
k=0 "
k=1
k=1
(
)
(
)(
)
(
)
k −1:= h ⇒ k = h +1 ⇒ h = 0,...,n −1 da cui segue
n−1
n−1
n−1 #
& h n−1−h
n! p h+1q n−1−h
(n −1)! p h q n−1−h
n
−1
x =∑
= np∑
= np∑%
. L’ultima
(p q
h!
n
−1−
h
!
h!
n
−1−
h
!
h
'
h=0
h=0
h=0 $
n !
$ k n−k
n
n
sommatoria è lo sviluppo del binomio di Newton a + b = ∑#
&a b ; nel
k=0 " k %
n−1 "
% h n−1−h
n−1
n
−1
nostro caso quindi, ∑$
= p + q =1essendo p + q =1. Da
'p q
h &
h=0 #
questo segue il risultato atteso: x = np .
(
)
(
)
(
)
Approfondimento: calcolo del valor medio della distribuzione
di Poisson
∞
∞
k
λ k−1
−λ λ
−λ
x = ∑ ke
=λ e ∑
=λ e − λ e λ = λ , avendo utilizzato nell’ultima
k!
k=0
k=0 (k −1)!
uguaglianza lo sviluppo in serie di Taylor della funzione esponenziale.
Oppure, un altro modo per dedurre il valor medio è il seguente:
∞
∞
k+1
λ k e−λ ∞
λ k+1
−λ λ
−λ
−λ λ
1= e e = e ∑ =
∑ k +1 k +1 ! ⇒ λ = ∑ k +1 e k +1 ! , dove
k!
λ
k=0
k=0
k=0
(
)
(
)
(
)
(
)
nell’ultima espressione si riconosce la definizione generale di valore medio
k+1
−λ λ
di una variabile aleatoria discreta con probabilità pk+1 = e
.
k +1 !
(
)
29