Sessione Live #5
Settimana dal 12 al 18 maggio 2003
Variabili aleatorie notevoli
V.a. discrete: uniforme, bernoulliana, binomiale,
ipergeometrica, geometrica, binomiale negativa, poissoniana.
V.a. continue: uniforme, esponenziale, gamma, normale.
Lezioni CD:
15-16-17
Esercizio 1
Un generatore di numeri interi casuali produce numeri uniformemente distribuiti tra 1 e
N, con una deviazione standard pari a 3,162.
Calcolare la probabilità di ottenere numeri che distino più di 1 dalla media.
Soluzione
Se rappresentiamo il generatore con una v.a. X, la sua f.d.d.
1
f X ( x) =
N
f
X
vale:
x =1, 2, … , N
e 0 altrimenti. Ricordando le formule note (o con un facile calcolo), la media vale
µ ≡ E [ X ] = ( N + 1) / 2
e la varianza
σ = ( N − 1) /12 .
2
2
Uguagliando quest’ultima espressione al dato fornito dal testo, si ottiene
N −1
= (3,162)2 = 10
12
2
⇒
N 2 = 121
e dunque N=11. Da qui si ricava la media, pari a 6.
I valori che distano al più 1 dalla media sono 5, 6 e 7, dunque il risultato voluto è:
3 8
P  X − µ > 1 = 1 − P  X − µ ≤ 1 = 1 − P  X ∈ {5, 6, 7} = 1 − =
11 11
Esercizio 2
Sapendo che il 10% delle persone che acquistano un biglietto aereo poi non si
presentano all'imbarco, una compagnia aerea vende 11 biglietti per aerei da 10 posti e
22 biglietti per aerei da 20 posti. Con quale tipo di aereo è maggiore la probabilità di
lasciare a terra qualcuno che ha regolarmente comperato il biglietto?
Soluzione
La frase “il 10% delle persone che acquistano un biglietto poi non si presentano
all’imbarco” induce ad assumere il seguente modello probabilistico: ogni passeggero che
ha acquistato il biglietto, indipendentemente da ciò che faranno gli altri, si presenterà o
non si presenterà all’imbarco con probabilità pari rispettivamente a 9/10 e 1/10.
Siano X ed Y rispettivamente il numero di passeggeri che si presentano realmente in un
volo da 10 e da 20 posti. Da quanto appena detto, si ha che
X ~ Bin(n=11,p=0.9)
e
Y ~ Bin(n=22,p=0.9)
Occorre dunque confrontare le due probabilità P[X>10] e P[Y>20]:
11
11
11
P [ X > 10] = P [ X = 11] =   ⋅ ( 0,9 ) = ( 0,9 )
11
0,314
 22 
 22 
21
22
P [Y > 20] = P [Y = 21] + P [Y = 22] =   ( 0,9 ) ⋅ 0,1 +   ( 0,9 )
 21 
 22 
Dunque è più probabile che qualcuno resti a terra dal secondo aereo.
0,339
Esercizio 3 – parte I
Il piccolo Lillo è al supermercato col papà, quando vede un enorme bancone pieno di
ovetti kinder, con un cartello che informa: “Una sorpresa su cinque è un meraviglioso
Pokemon!”. Lillo corre verso il papà gridando: “Voglio un Pokemon!”. Il papà annuisce:
“Va bene Lillo, ti compro l’ovetto.” Ma Lillo ribatte “Io non voglio l’ovetto, voglio un
Pokemon!”. Il papà ci pensa un po’ su, quindi decide di acquistare dodici ovetti,
confidando che almeno uno contenga un Pokemon.
a) Vi sembra sensata la strategia del papà? Qual è la probabilità che nessuno dei 12
ovetti contenga un Pokemon?
(Sugg.: Come va interpretata la frase “una sorpresa su cinque è un Pokemon”? Quale
modello probabilistico occorre adottare per valutare le probabilità in gioco?)
b) Quanti ovetti bisogna acquistare, in media, prima di trovare un Pokemon? Quanti,
invece, prima di trovarne due?
c) Prima che il papà arrivi alla cassa, Lillo prende due ovetti dal carrello e di nascosto li
apre, non trovando nessun Pokemon. Il papà se ne accorge, lo sgrida e torna a
prendere due ovetti dal bancone.
Come cambiano le risposte ai punti precedenti, in questa nuova situazione?
Soluzione
a) Negli esercizi di questo tipo, la frase “una sorpresa su cinque è un Pokemon” va
interpretata come “ogni ovetto ha 1/5 di possibilità di contenere un Pokemon,
indipendentemente dagli altri”. (Dunque potrebbe accadere l’infausto, improbabile caso
che nessuno degli ovetti presenti contenga Pokemon!)
Il modello da adottare è quello di ripetute prove bernoulliane indipendenti: la v.a. che
conta il numero di “successi” (ossia di ovetti con Pokemon) quando il papà compra n
ovetti è quindi una v.a. binomiale B ( n,1/ 5 ) .
Per valutare la strategia del papà, come suggerito, conviene calcolare la probabilità di
non trovare alcun Pokemon negli n ovetti:
( )
()() ()
n
n 1 0 4 n


1
4
α ≡ Prob B n, = 0 =  
=


n
5
5
5
 0 5
Per n=12 abbiamo α12 = 0,069 , mentre per es. per n=8 abbiamo α 8 = 0,168 :
riducendo di un terzo gli ovetti da acquistare, la probabilità di non trovare alcun
Pokemon è meno del 17%... fate voi!
b) Il “numero medio di ovetti da comprare prima di trovare un Pokemon” si traduce in
termini probabilistici nel “numero medio di insuccessi prima di avere il primo successo”.
Data una serie di prove ripetute indipendenti bernoulliane con probabilità di successo p,
la v.a. Y che conta gli insuccessi prima del primo successo è una v.a. geometrica di
parametro p:
P [Y = x ] = p ⋅ q x
x = 0,1, 2,…
Il valore medio di tale v.a. è noto, e vale q/p=4. In alternativa, si può effettuare
direttamente il calcolo del tempo medio T, con un piccolo stratagemma:
∞
∞
∞
d

x
x −1
x
T = ∑ x ⋅ pq = pq ∑ x ⋅ q = pq ⋅  ∑ q 
dq  x =1 
x =0
x =1
Si ricordi che la somma tra parentesi quadre (che comincia da 1) vale 1/(1-q) – 1; la
derivata vale (il –1 è ininfluente):
d  ∞ x
1
1
q =
= 2
∑
2

dq  x =1  (1 − q)
p
⇒
1 q
T = pq 2 =
p
p
La v.a. aleatoria W che conta il numero di insuccessi che occorrono prima dell’r-esimo
successo, in una serie di prove bernoulliane indipendenti ripetute con probabilità di
successo p, è una v.a. binomiale negativa, di parametri p e r. La sua f.d.d. è facile da
tenere a mente, come dice il nome:
 r + x − 1 r x  − r  r
x
f ( x; r , p ) = 
p q =   p ( −q )

x

x 
x = 0,1, 2,...
Media e varianza di tale v.a. si ricordano facilmente, se si pensa che la binomiale
negativa di parametro r è la somma di r v.a. geometriche indipendenti.
Da ciò segue che media e varianza sono r volte quelle della v.a. geometrica
corrispondente (varianza, non deviazione standard!):
q
E [W ] = r ⋅
p
q
σ =r⋅ 2
p
2
W
(Lo stesso identico legame c’è tra la binomiale e la bernoulli, e nel caso continuo tra la
gamma e la esponenziale: è buona cosa da tenere a mente.)
Si ottiene dunque che il numero medio di ovetti “perdenti” da aprire prima di trovarne
due “vincenti” è pari a 8; quindi prima di trovare il secondo Pokemon, si scarteranno in
media 9 ovetti.
c) Le risposte non cambierebbero, perché le successive prove sono indipendenti, e
dunque sapere che i primi due ovetti non contengono Pokemon non altera le probabilità
che i successivi ne contengano.
L’esito che hanno avuto le prime aperture, qualunque sia stato, non influenza le
successive.
In alternativa, si può verificare direttamente che le probabilità in gioco non variano.
L’evento “i primi due ovetti non contengono Pokemon” equivale a [Y ≥ 2] .
La probabilità che il papà non trovi alcun Pokemon nei successivi 12 ovetti, una volta
che Lillo ha aperto i primi due, si scrive dunque:
P[Y ≥ 14 | Y ≥ 2]
Ma questa probabilità coincide con P [Y ≥ 12] , per la nota assenza di memoria della legge
geometrica.
Esercizio 3 - Parte II
Supponiamo ora che, invece di “una sorpresa su cinque”, il cartello dicesse: “Questo
bancone contiene 1000 ovetti, 200 dei quali contengono un Pokemon”.
d) Cambierebbe il problema, in questo caso? Ossia, cambierebbero le risposte date ai
punti precedenti? Se sì, qual è il nuovo modello probabilistico da usare?
(Sugg.: Pensate a che cosa succede, nei due casi, acquistando 801 ovetti...)
e) Ai fini pratici, vale davvero la pena rifare i conti per il nuovo modello?
Soluzione
d) La risposta è sì, il problema cambierebbe.
Infatti in questo caso è come se fossimo di fronte a un’urna che contiene 1000 palline,
di cui 200 “vincenti”. Le successive estrazioni NON sono indipendenti: la probabilità che
il secondo ovetto contenga un Pokemon è diversa, a seconda che il primo ovetto
contenga o non contenga un Pokemon, e vale rispettivamente 199/999 o 200/999.
(In questo caso, acquistando 801 ovetti si ha la certezza di trovare un Pokemon!)
Acquistando n ovetti, la v.a. che conta il numero di ovetti vincenti non è più binomiale,
bensì ipergeometrica f (M,k,n), di parametri M=1000, k=200, n=n.
- Per la domanda al punto a), applicando la formula della f.d.d. per l’ipergeometrica (o
più semplicemente con un calcolo diretto) si trova che
 200  800 



n
0

 = 800 ⋅ 799 ⋅
β ≡ Prob [ f (1000, 200, n) = 0] = 
n
1000 999
1000 


n 
⋅
800 − n + 1
1000 − n + 1
e dunque β12 = 0,068 , mentre ad es. β 8 = 0,167 (valori molto simili a quelli ricavati
nella prima parte): si ripetono dunque le considerazioni fatte al punto a).
- Per quanto riguarda il punto b), il calcolo esplicito del numero medio di ovetti non
verrà effettuato: in questo caso la v.a. che conta gli insuccessi prima del primo
successo non è una v.a. notevole (certamente non è geometrica), e non si riesce ad
esprimere il risultato in forma semplice.
(Chi ha voglia può “divertirsi” a scrivere esplicitamente la f.d.d. e la media di tale v.a.:
concettualmente non è difficile, solo che si ottengono formule abbastanza complicate.)
- Anche per il punto c) non facciamo esplicitamente i calcoli ma, come è stato già
sottolineato, in questo secondo caso il fatto che Lillo abbia trovato due ovetti “perdenti”
aumenta la probabilità che i seguenti ovetti siano “vincenti”.
e) Come si è potuto notare nel calcolo di β12 e β8 , ai fini pratici non era necessario
rifare i conti.
Questo si poteva prevedere: infatti quando n/M è piccolo (è sufficiente che sia <1),
come nel nostro caso, la distribuzione ipergeometrica si può approssimare con una
binomiale di parametri n e k/M: in parole povere, se il numero di estrazioni è molto
minore del numero totale di palline nell’urna, la variazione di probabilità nelle
successive estrazioni è molto bassa (200/1000 non è molto differente da 199/999 o
200/999), e le estrazioni si possono considerare approssimativamente indipendenti.
Applicato alla nostra situazione, ciò significa che i conti della seconda parte possono
essere approssimati con quelli della prima parte.
Esercizio 4
Si può assumere che, per un certo geyser, le emissioni seguano approssimativamente
un processo di Poisson. Il numero medio di emissioni che si osservano in un giorno (in
24 ore) è pari a 18. Si calcolino:
a) Il numero medio di emissioni che si osservano in un’ora.
b) La probabilità che in 10 ore si osservino esattamente 3 emissioni, almeno 3
emissioni, al più 3 emissioni. Qual è il numero medio di emissioni, in 10 ore?
c) La probabilità che la prima eruzione avvenga dopo più di 5 ore.
Qualche richiamo di teoria
Il processo di Poisson descrive una situazione in cui certi avvenimenti, detti “arrivi”,
accadono nel tempo in maniera casuale, con opportune proprietà descritte nelle lezioni
(le più importanti saranno richiamate nel seguito). Esso è caratterizzato da un
parametro ν , detto intensità, pari al numero medio di arrivi in un’unità di tempo scelta.
Il processo di Poisson NON è una v.a. (non nel senso in cui a voi è stata definita).
Altra cosa è invece la v.a. di Poisson, che è una v.a. discreta determinata da un
parametro λ , la cui f.d.d. è data da
f ( x; λ ) = e
x
λ
−λ
x!
x = 0,1, 2,…
e 0 altrimenti. Sia la media sia la varianza di tale v.a. sono uguali al parametro
λ.
Il legame tra questi due oggetti matematici è dato dalla seguente proprietà: in un
processo di Poisson di parametro ν , la v.a. che conta gli arrivi in un intervallo di tempo
di ampiezza t è una v.a. di Poisson di parametro λ = ν ⋅ t .
Quindi in un processo di Poisson il numero medio di arrivi in un tempo t è pari a ν ⋅ t .
Infine, la v.a. (continua) che rappresenta l’istante in cui avviene il primo arrivo, è
distribuita come una v.a. esponenziale, di parametro pari all’intensità del processo,
ossia ν .
Soluzione
a) Il dato fornito dal testo è il numero medio di arrivi, riferito a un’intervallo di tempo
pari a 24 ore. Qui ci viene richiesto di riferirlo a un’ora: dato che nel Processo di Poisson
il numero medio di arrivi in un intervallo di tempo è una funzione lineare dell’ampiezza
dell’intervallo, occorre dividere per 24 il dato. Si ottiene
18
ν=
= 0, 75
24
Dal momento che in tutte le domande i tempi sono espressi in ore, conviene scegliere
come nostra unità di tempo 1 ora.
Dunque, se ci riferiamo a questa unità di tempo, il parametro del nostro processo di
Poisson risulta pari al valore ν appena trovato.
b) La v.a.
X 10 che conta il numero di emissioni in un intervallo di tempo di 10 ore è una
v.a. di Poisson di parametro λ = ν ⋅ t = 0,75 ⋅10 = 7,5 . Il numero medio di emissioni in
10 ore è dunque pari a 7,5.
La probabilità di osservare esattamente 3 emissioni è
3
(7,5)
P [ X 10 = 3] = f (3;7,5) = e−7,5
3!
0,039
La probabilità di osservarne almeno 3 vale invece
0
1
2


(7,5)
(7,5)
(7,5)
−7,5
P [ X 10 ≥ 3] = 1 − P [ X 10 ≤ 2] = 1 − e 
0,980
+
+

1!
2! 
 0!
Infine, la probabilità di osservarne al più 3 è pari a
0
1
2
3


(7,5)
(7,5)
(7,5)
(7,5)
−7,5
P [ X10 ≤ 3] = e 
0,059
+
+
+

1!
2!
3! 
 0!
c) Dire che la prima eruzione avviene dopo più di 5 ore equivale a dire che non ci sono
state emissioni nelle prime 5 ore, ossia che X 5 = 0 .
Ricordando che
X 5 è una v.a. di Poisson di parametro λ = 0,75 ⋅ 5 = 3,75 , si ha che
0
(3,75)
P [ X 5 = 0] = f (0;3,75) = e −3,75
= e−3,75
0!
0,024
Un modo più diretto di rispondere alla domanda è quello di considerare che l’istante in
cui si osserva il primo arrivo T è una v.a. esponenziale di parametro ν : T ~ Exp(ν ).
Ricordando che la F.D.R. di una variabile esponenziale è data da
F ( x) = 1 − e−ν ⋅ x
si ottiene il risultato
P [T > 5] = 1 − P [T ≤ 5] = 1 − F (5) = e −0,75⋅5 = e −3,75
che, come deve essere, coincide col precedente.
0,024
Esercizio 5
I transistor della ditta “TS” hanno un tempo di vita distribuito come una v.a.
esponenziale. Si sa che in media ciascun transistor dura due anni.
a) Calcolare la probabilità che uno di questi transistor funzioni per meno di 18 mesi.
b) Un transistor TS sta funzionando ininterrottamente da due anni. Qual è la probabilità
che “resista” per un altro anno?
c) Vengono collegati in serie tre transistor TS. Qual è la probabilità che questo circuito
funzioni per almeno due anni, supponendo che le durate dei tre transistor siano
indipendenti?
d) Nel circuito di una macchina industriale è inserito un transistor; c’è un dispositivo
che, non appena il transistor si rompe, lo sostituisce con un transistor nuovo, fino ad un
massimo di 4 sostituzioni. Se tutti gli altri componenti della macchina non sono soggetti
a rottura, quanto tempo in media passerà prima che la macchina smetta di funzionare?
e) Qual è la f.d.d. della v.a. che rappresenta la durata della macchina al punto d)?
Soluzione
a) Si ricordi che per una v.a. distribuita esponenzialmente con parametro ν la media è
pari a 1/ν . Dal momento che la vita media di un transistor è pari a 2 anni, si ha che la
v.a. X che rappresenta la durata di un transistor è distribuita come ~ Exp(1/2).
Si potrebbe calcolare la probabilità richiesta con un semplice integrale, ma non è
necessario fare alcun conto. Basta ricordare che, per una v.a. ~ Exp(ν ), la F.D.R. è
nota esplicitamente:
F ( x) = 1 − e−ν ⋅ x
Dunque, tenendo presente che 18 mesi corrispondono a 1,5 anni, si ottiene che
P [ X < 1,5] = P [ X ≤ 1,5] = F (1,5) = 1 − e−0,5⋅1,5
0,528
b) Ricordando la proprietà dell’assenza di memoria, che accomuna le v.a. geometriche
(caso discreto) e esponenziali (caso continuo), si ha che
P [ X > 3 | X > 2 ] = P [ X > (3 − 2) ] = e −0,5
0,607
c) Affinché il circuito funzioni per almeno due anni occorre che tutti e tre i transistor
funzionino per almeno tre anni: la probabilità cercata è dunque
α =P ( X 1 > 3) ∩ ( X 2 > 3) ∩ ( X 3 > 3) 
Tenendo conto che le v.a.
si ottiene infine che
X1, X 2 , X 3
sono indipendenti e hanno la stessa distribuzione,
α = ( P [ X>3]) = (1 − F (3))3 = (e−3⋅0,5 )3 0,011
3
d) Il tempo di vita della macchina è pari alla somma delle durate di 5 transistor. Per la
linearità della media, il suo valore medio e’ la somma delle durate medie, e vale dunque
10 anni.
(Si noti che, ai fini di questa domanda, non e’ necessario assumere l’indipendenza!)
e) Come è stato detto, la v.a. che rappresenta la durata della macchina è somma di 5
v.a. indipendenti, distribuite esponenzialmente, e dunque è distribuita come una
gamma di parametri r=5 e ν =0,5.
(In questo caso l’indipendenza gioca un ruolo fondamentale!)
Esercizio 6
Una bilancia difettosa ha un errore sistematico di 0,1g ed un errore casuale che
si suppone avere la distribuzione N(0; 4/25) (si osservi che si possono avere anche
risultati negativi!).
Si sottopone alla misura un campione di 0,9g. Stimare, con l’ausilio della tavola dei
quantili per la distribuzione normale:
a) la probabilità che la misura dia un risultato compreso tra 0,8g e 1g;
b) la probabilità che la misura dia un risultato superiore a 1g;
c) la probabilità che il valore assoluto della misura sia minore di 0,9g.
d) il valore al di sotto del quale, col 90% di probabilità, cadrà la misura.
Soluzione
a) Innanzitutto conviene standardizzare la variabile aleatoria X che rappresenta la
dispersione:
4
X ∼ N (0; )
25
⇒
5
X ∼ N (0;1) ≡ Z
2
La v.a. M che dà il risultato della misura è la somma di X + (errore sistematico) + (peso
dell’oggetto), dunque M = X + 0,1 + 0,9 = X + 1 , il tutto espresso in grammi.
L’evento (8/10 < M < 1) coincide con l’evento (-2/10 < X < 0), che a sua volta coincide
con (-5/10 < Z < 0). Per valutare la probabilità di questo evento, si usa la simmetria
della distribuzione normale e la tabelle dei quantili, ottenendo:
1
1
 1



1
P - <Z<0 = P 0<Z<  = P 0<Z ≤  = Φ   − 0,5 0,1915
2
2
 2



 2
b) Si ha che (M < 1) equivale a (X < 0), ossia (Z < 0). Per la simmetria della
distribuzione gaussiana, la probabilità di tale evento vale 0,5.
c) Sussistono le seguenti relazioni tra eventi:
{
}
9

 9 9  
 19 1    5
 19 1  
= M ∈  − ;  =  X ∈  − ; −  =  X ∈  − ; − 
| M |<
10 
 10 10   
 10 10    2
 4 4 
⇒
9


 19 1  
 19 
1
P | M |<  = P  Z ∈  − ; −   = Φ   − Φ  
10 

 4 4 
 4
4

d) Dobbiamo cercare il valore
in termini di Z:
x
tale che P[M <
{
0, 4013
x ]=0,9. Traduciamo questa relazione
}{
}
5
x −1
x −1
= Z < 5⋅
= {Z < z}
{M < x} = { X < x − 1} = X < 5 ⋅
2
2
2
Dalle tabelle dei quantili si ricava che il valore z per cui P[Z < z]=0,9 è circa z=1,2815.
Risolvendo una semplice equazione si ottiene quindi che:
x −1
=z
5⋅
2
⇒
2
x = z + 1 1,5126
5
Esercizio 7
La durata in ore di una lampadina segue una legge normale di media µ = 2000 e
varianza incognita σ . Un compratore richiede che almeno il 90% di esse abbia una
durata superiore a 1500 ore.
2
Qual è il valore massimo che σ può assumere per soddisfare l’esigenza
dell’acquirente?
2
Soluzione
Sia X la v.a. che corrisponde alla durata di una lampadina: X ~ N( µ , σ ), con µ = 2000.
Ricordiamo che la standardizzata di X è Z=(X- µ )/σ .
Dobbiamo imporre che P[X > 1500] > 0,9. Vale la seguente relazione tra eventi:
2
{X
> 1500} =
{
X −µ
σ
>
1500 − µ
σ
}{
= Z >−
σ } {
500
= Z<
500
σ
}
Quindi la disuguaglianza diviene:
500 

 500 
P [ X > 1500] = P  Z <
= Φ
 ≥ 0,9

σ 

 σ 
Dalle tabelle si ricava che il 90 percentile della normale standard è pari a circa 1,2816.
Occorre dunque imporre che:
500
σ
≥ 1, 2816
⇒
500
σ≤
1,2816
390