Sessione Live #5 Settimana dal 12 al 18 maggio 2003 Variabili aleatorie notevoli V.a. discrete: uniforme, bernoulliana, binomiale, ipergeometrica, geometrica, binomiale negativa, poissoniana. V.a. continue: uniforme, esponenziale, gamma, normale. Lezioni CD: 15-16-17 Esercizio 1 Un generatore di numeri interi casuali produce numeri uniformemente distribuiti tra 1 e N, con una deviazione standard pari a 3,162. Calcolare la probabilità di ottenere numeri che distino più di 1 dalla media. Soluzione Se rappresentiamo il generatore con una v.a. X, la sua f.d.d. 1 f X ( x) = N f X vale: x =1, 2, … , N e 0 altrimenti. Ricordando le formule note (o con un facile calcolo), la media vale µ ≡ E [ X ] = ( N + 1) / 2 e la varianza σ = ( N − 1) /12 . 2 2 Uguagliando quest’ultima espressione al dato fornito dal testo, si ottiene N −1 = (3,162)2 = 10 12 2 ⇒ N 2 = 121 e dunque N=11. Da qui si ricava la media, pari a 6. I valori che distano al più 1 dalla media sono 5, 6 e 7, dunque il risultato voluto è: 3 8 P X − µ > 1 = 1 − P X − µ ≤ 1 = 1 − P X ∈ {5, 6, 7} = 1 − = 11 11 Esercizio 2 Sapendo che il 10% delle persone che acquistano un biglietto aereo poi non si presentano all'imbarco, una compagnia aerea vende 11 biglietti per aerei da 10 posti e 22 biglietti per aerei da 20 posti. Con quale tipo di aereo è maggiore la probabilità di lasciare a terra qualcuno che ha regolarmente comperato il biglietto? Soluzione La frase “il 10% delle persone che acquistano un biglietto poi non si presentano all’imbarco” induce ad assumere il seguente modello probabilistico: ogni passeggero che ha acquistato il biglietto, indipendentemente da ciò che faranno gli altri, si presenterà o non si presenterà all’imbarco con probabilità pari rispettivamente a 9/10 e 1/10. Siano X ed Y rispettivamente il numero di passeggeri che si presentano realmente in un volo da 10 e da 20 posti. Da quanto appena detto, si ha che X ~ Bin(n=11,p=0.9) e Y ~ Bin(n=22,p=0.9) Occorre dunque confrontare le due probabilità P[X>10] e P[Y>20]: 11 11 11 P [ X > 10] = P [ X = 11] = ⋅ ( 0,9 ) = ( 0,9 ) 11 0,314 22 22 21 22 P [Y > 20] = P [Y = 21] + P [Y = 22] = ( 0,9 ) ⋅ 0,1 + ( 0,9 ) 21 22 Dunque è più probabile che qualcuno resti a terra dal secondo aereo. 0,339 Esercizio 3 – parte I Il piccolo Lillo è al supermercato col papà, quando vede un enorme bancone pieno di ovetti kinder, con un cartello che informa: “Una sorpresa su cinque è un meraviglioso Pokemon!”. Lillo corre verso il papà gridando: “Voglio un Pokemon!”. Il papà annuisce: “Va bene Lillo, ti compro l’ovetto.” Ma Lillo ribatte “Io non voglio l’ovetto, voglio un Pokemon!”. Il papà ci pensa un po’ su, quindi decide di acquistare dodici ovetti, confidando che almeno uno contenga un Pokemon. a) Vi sembra sensata la strategia del papà? Qual è la probabilità che nessuno dei 12 ovetti contenga un Pokemon? (Sugg.: Come va interpretata la frase “una sorpresa su cinque è un Pokemon”? Quale modello probabilistico occorre adottare per valutare le probabilità in gioco?) b) Quanti ovetti bisogna acquistare, in media, prima di trovare un Pokemon? Quanti, invece, prima di trovarne due? c) Prima che il papà arrivi alla cassa, Lillo prende due ovetti dal carrello e di nascosto li apre, non trovando nessun Pokemon. Il papà se ne accorge, lo sgrida e torna a prendere due ovetti dal bancone. Come cambiano le risposte ai punti precedenti, in questa nuova situazione? Soluzione a) Negli esercizi di questo tipo, la frase “una sorpresa su cinque è un Pokemon” va interpretata come “ogni ovetto ha 1/5 di possibilità di contenere un Pokemon, indipendentemente dagli altri”. (Dunque potrebbe accadere l’infausto, improbabile caso che nessuno degli ovetti presenti contenga Pokemon!) Il modello da adottare è quello di ripetute prove bernoulliane indipendenti: la v.a. che conta il numero di “successi” (ossia di ovetti con Pokemon) quando il papà compra n ovetti è quindi una v.a. binomiale B ( n,1/ 5 ) . Per valutare la strategia del papà, come suggerito, conviene calcolare la probabilità di non trovare alcun Pokemon negli n ovetti: ( ) ()() () n n 1 0 4 n 1 4 α ≡ Prob B n, = 0 = = n 5 5 5 0 5 Per n=12 abbiamo α12 = 0,069 , mentre per es. per n=8 abbiamo α 8 = 0,168 : riducendo di un terzo gli ovetti da acquistare, la probabilità di non trovare alcun Pokemon è meno del 17%... fate voi! b) Il “numero medio di ovetti da comprare prima di trovare un Pokemon” si traduce in termini probabilistici nel “numero medio di insuccessi prima di avere il primo successo”. Data una serie di prove ripetute indipendenti bernoulliane con probabilità di successo p, la v.a. Y che conta gli insuccessi prima del primo successo è una v.a. geometrica di parametro p: P [Y = x ] = p ⋅ q x x = 0,1, 2,… Il valore medio di tale v.a. è noto, e vale q/p=4. In alternativa, si può effettuare direttamente il calcolo del tempo medio T, con un piccolo stratagemma: ∞ ∞ ∞ d x x −1 x T = ∑ x ⋅ pq = pq ∑ x ⋅ q = pq ⋅ ∑ q dq x =1 x =0 x =1 Si ricordi che la somma tra parentesi quadre (che comincia da 1) vale 1/(1-q) – 1; la derivata vale (il –1 è ininfluente): d ∞ x 1 1 q = = 2 ∑ 2 dq x =1 (1 − q) p ⇒ 1 q T = pq 2 = p p La v.a. aleatoria W che conta il numero di insuccessi che occorrono prima dell’r-esimo successo, in una serie di prove bernoulliane indipendenti ripetute con probabilità di successo p, è una v.a. binomiale negativa, di parametri p e r. La sua f.d.d. è facile da tenere a mente, come dice il nome: r + x − 1 r x − r r x f ( x; r , p ) = p q = p ( −q ) x x x = 0,1, 2,... Media e varianza di tale v.a. si ricordano facilmente, se si pensa che la binomiale negativa di parametro r è la somma di r v.a. geometriche indipendenti. Da ciò segue che media e varianza sono r volte quelle della v.a. geometrica corrispondente (varianza, non deviazione standard!): q E [W ] = r ⋅ p q σ =r⋅ 2 p 2 W (Lo stesso identico legame c’è tra la binomiale e la bernoulli, e nel caso continuo tra la gamma e la esponenziale: è buona cosa da tenere a mente.) Si ottiene dunque che il numero medio di ovetti “perdenti” da aprire prima di trovarne due “vincenti” è pari a 8; quindi prima di trovare il secondo Pokemon, si scarteranno in media 9 ovetti. c) Le risposte non cambierebbero, perché le successive prove sono indipendenti, e dunque sapere che i primi due ovetti non contengono Pokemon non altera le probabilità che i successivi ne contengano. L’esito che hanno avuto le prime aperture, qualunque sia stato, non influenza le successive. In alternativa, si può verificare direttamente che le probabilità in gioco non variano. L’evento “i primi due ovetti non contengono Pokemon” equivale a [Y ≥ 2] . La probabilità che il papà non trovi alcun Pokemon nei successivi 12 ovetti, una volta che Lillo ha aperto i primi due, si scrive dunque: P[Y ≥ 14 | Y ≥ 2] Ma questa probabilità coincide con P [Y ≥ 12] , per la nota assenza di memoria della legge geometrica. Esercizio 3 - Parte II Supponiamo ora che, invece di “una sorpresa su cinque”, il cartello dicesse: “Questo bancone contiene 1000 ovetti, 200 dei quali contengono un Pokemon”. d) Cambierebbe il problema, in questo caso? Ossia, cambierebbero le risposte date ai punti precedenti? Se sì, qual è il nuovo modello probabilistico da usare? (Sugg.: Pensate a che cosa succede, nei due casi, acquistando 801 ovetti...) e) Ai fini pratici, vale davvero la pena rifare i conti per il nuovo modello? Soluzione d) La risposta è sì, il problema cambierebbe. Infatti in questo caso è come se fossimo di fronte a un’urna che contiene 1000 palline, di cui 200 “vincenti”. Le successive estrazioni NON sono indipendenti: la probabilità che il secondo ovetto contenga un Pokemon è diversa, a seconda che il primo ovetto contenga o non contenga un Pokemon, e vale rispettivamente 199/999 o 200/999. (In questo caso, acquistando 801 ovetti si ha la certezza di trovare un Pokemon!) Acquistando n ovetti, la v.a. che conta il numero di ovetti vincenti non è più binomiale, bensì ipergeometrica f (M,k,n), di parametri M=1000, k=200, n=n. - Per la domanda al punto a), applicando la formula della f.d.d. per l’ipergeometrica (o più semplicemente con un calcolo diretto) si trova che 200 800 n 0 = 800 ⋅ 799 ⋅ β ≡ Prob [ f (1000, 200, n) = 0] = n 1000 999 1000 n ⋅ 800 − n + 1 1000 − n + 1 e dunque β12 = 0,068 , mentre ad es. β 8 = 0,167 (valori molto simili a quelli ricavati nella prima parte): si ripetono dunque le considerazioni fatte al punto a). - Per quanto riguarda il punto b), il calcolo esplicito del numero medio di ovetti non verrà effettuato: in questo caso la v.a. che conta gli insuccessi prima del primo successo non è una v.a. notevole (certamente non è geometrica), e non si riesce ad esprimere il risultato in forma semplice. (Chi ha voglia può “divertirsi” a scrivere esplicitamente la f.d.d. e la media di tale v.a.: concettualmente non è difficile, solo che si ottengono formule abbastanza complicate.) - Anche per il punto c) non facciamo esplicitamente i calcoli ma, come è stato già sottolineato, in questo secondo caso il fatto che Lillo abbia trovato due ovetti “perdenti” aumenta la probabilità che i seguenti ovetti siano “vincenti”. e) Come si è potuto notare nel calcolo di β12 e β8 , ai fini pratici non era necessario rifare i conti. Questo si poteva prevedere: infatti quando n/M è piccolo (è sufficiente che sia <1), come nel nostro caso, la distribuzione ipergeometrica si può approssimare con una binomiale di parametri n e k/M: in parole povere, se il numero di estrazioni è molto minore del numero totale di palline nell’urna, la variazione di probabilità nelle successive estrazioni è molto bassa (200/1000 non è molto differente da 199/999 o 200/999), e le estrazioni si possono considerare approssimativamente indipendenti. Applicato alla nostra situazione, ciò significa che i conti della seconda parte possono essere approssimati con quelli della prima parte. Esercizio 4 Si può assumere che, per un certo geyser, le emissioni seguano approssimativamente un processo di Poisson. Il numero medio di emissioni che si osservano in un giorno (in 24 ore) è pari a 18. Si calcolino: a) Il numero medio di emissioni che si osservano in un’ora. b) La probabilità che in 10 ore si osservino esattamente 3 emissioni, almeno 3 emissioni, al più 3 emissioni. Qual è il numero medio di emissioni, in 10 ore? c) La probabilità che la prima eruzione avvenga dopo più di 5 ore. Qualche richiamo di teoria Il processo di Poisson descrive una situazione in cui certi avvenimenti, detti “arrivi”, accadono nel tempo in maniera casuale, con opportune proprietà descritte nelle lezioni (le più importanti saranno richiamate nel seguito). Esso è caratterizzato da un parametro ν , detto intensità, pari al numero medio di arrivi in un’unità di tempo scelta. Il processo di Poisson NON è una v.a. (non nel senso in cui a voi è stata definita). Altra cosa è invece la v.a. di Poisson, che è una v.a. discreta determinata da un parametro λ , la cui f.d.d. è data da f ( x; λ ) = e x λ −λ x! x = 0,1, 2,… e 0 altrimenti. Sia la media sia la varianza di tale v.a. sono uguali al parametro λ. Il legame tra questi due oggetti matematici è dato dalla seguente proprietà: in un processo di Poisson di parametro ν , la v.a. che conta gli arrivi in un intervallo di tempo di ampiezza t è una v.a. di Poisson di parametro λ = ν ⋅ t . Quindi in un processo di Poisson il numero medio di arrivi in un tempo t è pari a ν ⋅ t . Infine, la v.a. (continua) che rappresenta l’istante in cui avviene il primo arrivo, è distribuita come una v.a. esponenziale, di parametro pari all’intensità del processo, ossia ν . Soluzione a) Il dato fornito dal testo è il numero medio di arrivi, riferito a un’intervallo di tempo pari a 24 ore. Qui ci viene richiesto di riferirlo a un’ora: dato che nel Processo di Poisson il numero medio di arrivi in un intervallo di tempo è una funzione lineare dell’ampiezza dell’intervallo, occorre dividere per 24 il dato. Si ottiene 18 ν= = 0, 75 24 Dal momento che in tutte le domande i tempi sono espressi in ore, conviene scegliere come nostra unità di tempo 1 ora. Dunque, se ci riferiamo a questa unità di tempo, il parametro del nostro processo di Poisson risulta pari al valore ν appena trovato. b) La v.a. X 10 che conta il numero di emissioni in un intervallo di tempo di 10 ore è una v.a. di Poisson di parametro λ = ν ⋅ t = 0,75 ⋅10 = 7,5 . Il numero medio di emissioni in 10 ore è dunque pari a 7,5. La probabilità di osservare esattamente 3 emissioni è 3 (7,5) P [ X 10 = 3] = f (3;7,5) = e−7,5 3! 0,039 La probabilità di osservarne almeno 3 vale invece 0 1 2 (7,5) (7,5) (7,5) −7,5 P [ X 10 ≥ 3] = 1 − P [ X 10 ≤ 2] = 1 − e 0,980 + + 1! 2! 0! Infine, la probabilità di osservarne al più 3 è pari a 0 1 2 3 (7,5) (7,5) (7,5) (7,5) −7,5 P [ X10 ≤ 3] = e 0,059 + + + 1! 2! 3! 0! c) Dire che la prima eruzione avviene dopo più di 5 ore equivale a dire che non ci sono state emissioni nelle prime 5 ore, ossia che X 5 = 0 . Ricordando che X 5 è una v.a. di Poisson di parametro λ = 0,75 ⋅ 5 = 3,75 , si ha che 0 (3,75) P [ X 5 = 0] = f (0;3,75) = e −3,75 = e−3,75 0! 0,024 Un modo più diretto di rispondere alla domanda è quello di considerare che l’istante in cui si osserva il primo arrivo T è una v.a. esponenziale di parametro ν : T ~ Exp(ν ). Ricordando che la F.D.R. di una variabile esponenziale è data da F ( x) = 1 − e−ν ⋅ x si ottiene il risultato P [T > 5] = 1 − P [T ≤ 5] = 1 − F (5) = e −0,75⋅5 = e −3,75 che, come deve essere, coincide col precedente. 0,024 Esercizio 5 I transistor della ditta “TS” hanno un tempo di vita distribuito come una v.a. esponenziale. Si sa che in media ciascun transistor dura due anni. a) Calcolare la probabilità che uno di questi transistor funzioni per meno di 18 mesi. b) Un transistor TS sta funzionando ininterrottamente da due anni. Qual è la probabilità che “resista” per un altro anno? c) Vengono collegati in serie tre transistor TS. Qual è la probabilità che questo circuito funzioni per almeno due anni, supponendo che le durate dei tre transistor siano indipendenti? d) Nel circuito di una macchina industriale è inserito un transistor; c’è un dispositivo che, non appena il transistor si rompe, lo sostituisce con un transistor nuovo, fino ad un massimo di 4 sostituzioni. Se tutti gli altri componenti della macchina non sono soggetti a rottura, quanto tempo in media passerà prima che la macchina smetta di funzionare? e) Qual è la f.d.d. della v.a. che rappresenta la durata della macchina al punto d)? Soluzione a) Si ricordi che per una v.a. distribuita esponenzialmente con parametro ν la media è pari a 1/ν . Dal momento che la vita media di un transistor è pari a 2 anni, si ha che la v.a. X che rappresenta la durata di un transistor è distribuita come ~ Exp(1/2). Si potrebbe calcolare la probabilità richiesta con un semplice integrale, ma non è necessario fare alcun conto. Basta ricordare che, per una v.a. ~ Exp(ν ), la F.D.R. è nota esplicitamente: F ( x) = 1 − e−ν ⋅ x Dunque, tenendo presente che 18 mesi corrispondono a 1,5 anni, si ottiene che P [ X < 1,5] = P [ X ≤ 1,5] = F (1,5) = 1 − e−0,5⋅1,5 0,528 b) Ricordando la proprietà dell’assenza di memoria, che accomuna le v.a. geometriche (caso discreto) e esponenziali (caso continuo), si ha che P [ X > 3 | X > 2 ] = P [ X > (3 − 2) ] = e −0,5 0,607 c) Affinché il circuito funzioni per almeno due anni occorre che tutti e tre i transistor funzionino per almeno tre anni: la probabilità cercata è dunque α =P ( X 1 > 3) ∩ ( X 2 > 3) ∩ ( X 3 > 3) Tenendo conto che le v.a. si ottiene infine che X1, X 2 , X 3 sono indipendenti e hanno la stessa distribuzione, α = ( P [ X>3]) = (1 − F (3))3 = (e−3⋅0,5 )3 0,011 3 d) Il tempo di vita della macchina è pari alla somma delle durate di 5 transistor. Per la linearità della media, il suo valore medio e’ la somma delle durate medie, e vale dunque 10 anni. (Si noti che, ai fini di questa domanda, non e’ necessario assumere l’indipendenza!) e) Come è stato detto, la v.a. che rappresenta la durata della macchina è somma di 5 v.a. indipendenti, distribuite esponenzialmente, e dunque è distribuita come una gamma di parametri r=5 e ν =0,5. (In questo caso l’indipendenza gioca un ruolo fondamentale!) Esercizio 6 Una bilancia difettosa ha un errore sistematico di 0,1g ed un errore casuale che si suppone avere la distribuzione N(0; 4/25) (si osservi che si possono avere anche risultati negativi!). Si sottopone alla misura un campione di 0,9g. Stimare, con l’ausilio della tavola dei quantili per la distribuzione normale: a) la probabilità che la misura dia un risultato compreso tra 0,8g e 1g; b) la probabilità che la misura dia un risultato superiore a 1g; c) la probabilità che il valore assoluto della misura sia minore di 0,9g. d) il valore al di sotto del quale, col 90% di probabilità, cadrà la misura. Soluzione a) Innanzitutto conviene standardizzare la variabile aleatoria X che rappresenta la dispersione: 4 X ∼ N (0; ) 25 ⇒ 5 X ∼ N (0;1) ≡ Z 2 La v.a. M che dà il risultato della misura è la somma di X + (errore sistematico) + (peso dell’oggetto), dunque M = X + 0,1 + 0,9 = X + 1 , il tutto espresso in grammi. L’evento (8/10 < M < 1) coincide con l’evento (-2/10 < X < 0), che a sua volta coincide con (-5/10 < Z < 0). Per valutare la probabilità di questo evento, si usa la simmetria della distribuzione normale e la tabelle dei quantili, ottenendo: 1 1 1 1 P - <Z<0 = P 0<Z< = P 0<Z ≤ = Φ − 0,5 0,1915 2 2 2 2 b) Si ha che (M < 1) equivale a (X < 0), ossia (Z < 0). Per la simmetria della distribuzione gaussiana, la probabilità di tale evento vale 0,5. c) Sussistono le seguenti relazioni tra eventi: { } 9 9 9 19 1 5 19 1 = M ∈ − ; = X ∈ − ; − = X ∈ − ; − | M |< 10 10 10 10 10 2 4 4 ⇒ 9 19 1 19 1 P | M |< = P Z ∈ − ; − = Φ − Φ 10 4 4 4 4 d) Dobbiamo cercare il valore in termini di Z: x tale che P[M < { 0, 4013 x ]=0,9. Traduciamo questa relazione }{ } 5 x −1 x −1 = Z < 5⋅ = {Z < z} {M < x} = { X < x − 1} = X < 5 ⋅ 2 2 2 Dalle tabelle dei quantili si ricava che il valore z per cui P[Z < z]=0,9 è circa z=1,2815. Risolvendo una semplice equazione si ottiene quindi che: x −1 =z 5⋅ 2 ⇒ 2 x = z + 1 1,5126 5 Esercizio 7 La durata in ore di una lampadina segue una legge normale di media µ = 2000 e varianza incognita σ . Un compratore richiede che almeno il 90% di esse abbia una durata superiore a 1500 ore. 2 Qual è il valore massimo che σ può assumere per soddisfare l’esigenza dell’acquirente? 2 Soluzione Sia X la v.a. che corrisponde alla durata di una lampadina: X ~ N( µ , σ ), con µ = 2000. Ricordiamo che la standardizzata di X è Z=(X- µ )/σ . Dobbiamo imporre che P[X > 1500] > 0,9. Vale la seguente relazione tra eventi: 2 {X > 1500} = { X −µ σ > 1500 − µ σ }{ = Z >− σ } { 500 = Z< 500 σ } Quindi la disuguaglianza diviene: 500 500 P [ X > 1500] = P Z < = Φ ≥ 0,9 σ σ Dalle tabelle si ricava che il 90 percentile della normale standard è pari a circa 1,2816. Occorre dunque imporre che: 500 σ ≥ 1, 2816 ⇒ 500 σ≤ 1,2816 390