UNIVERSITÀ di ROMA TOR VERGATA Corso di Laurea Magistrale in Scienze della Nutrizione Umana Corso di Statistica Medica, anno 2015-16 P.Baldi Lista di esercizi 5, 18 febbraio 2016. Esercizio 1 Si fanno 625 estrazioni da un’urna contenente 5 palline numerate da 1 a 5 (ogni volta la pallina viene rimessa nell’urna). a) Qual è la probabilità che il numero 3 si presenti meno (≤) di 110 volte ? b) Qual è la probabilità che i numeri 2 e 3 si presentino insieme tra 240 e 260 volte (estremi compresi)? Esercizio 2 Due dadi vengono lanciati 360 volte. a) Mostrare che la probabilità di ottenere 7 in un singolo lancio è uguale a 16 . b) In media quante volte si otterrà 7 nei 360 lanci? c) Usando l’approssimazione normale, qual è la probabilità che nei 360 lanci il 7 compaia più di 66 volte ? d) Mostrare che la probabilità di ottenere 2 oppure 12 in un singolo lancio è uguale a 1 18 . e) In media quante volte si otterrà 2 oppure 12 nei 360 lanci? f) Usando l’approssimazione normale dire se è più probabile che nei 360 lanci il 7 compaia più di 66 volte oppure che il 2 o il 12 compaiano più di 26 volte ? Consiglio: se non si riesce a risolvere subito i punti a) e d), li si può dare per buoni e andare avanti. Esercizio 3 Gli intervalli di tempo tra due richieste di servizio a un centralino seguono una legge esponenziale di media 2 minuti. Cioè se si indicano T1 , . . . , Tn , . . . gli intertempi tra due chiamate successive, si suppone che le v.a. Ti siano indipendenti ed esponenziali di media 2 minuti. Qual è la probabilità che in 12 ore giungano più di 380 chiamate? Qual è la probabilità che ne giungano meno di 350 ? (Domanda preliminare: quanto vale la varianza di una v.a. esponenziale di media 2 ? Vedi gli appunti alle pag. 98-99). Esercizio 4 Una società produttrice di componenti elettronici vuole pubblicizzare che i suoi prodotti sono affidabili ed in particolare che tutti superano un certo test di qualità tranne una proporzione del 3%. Per potere essere al riparo da controlli decide quindi di fare un test sulla sua produzione. a) Supponiamo che la vera proporzione di pezzi che non superano il controllo sia p = 2.5%. Qual è la probabilità che in un campione di numerosità 100 vi siano più 1 (>) di 3 componenti che non superano il controllo ? Quale sarebbe il valore fornito dall’approssimazione normale ? Perché l’approssimazione normale non si può applicare in questo caso ? b) Supponiamo sempre che la vera proporzione di pezzi che non superano il controllo sia p = 2.5%. Dare un’approssimazione della probabilità che in un campione di numerosità 1000 vi siano più (>) di 30 pezzi che non superano il controllo. Esercizio 5 Una popolazione è formata da due gruppi, A e B. La proporzione di A nella popolazione è del 52%. Dalla popolazione viene scelto un campione di n individui. a) Supponiamo n = 100. Qual è la probabilità che nel campione vi sia almeno il 50% d’individui di A ? b) E se fosse n = 400 ? c) Come cambierebbero i risultati precedenti se non si facesse la correzione di continuità ? 2 Soluzioni Esercizio 1. a) Se poniamo Xi = 1 se alla i-esima estrazione si ottiene il 3 e Xi = 0 altrimenti, allora il numero di estrazioni che danno 3 sulle 625 è S = X1 + . . . + X625 . Le v.a. Xi sono dunque di Bernoulli B(1, 15 ); in particolare hanno media 15 e varianza 1 1 4 5 · (1 − 5 ) = 25 . Usando l’approssimazione normale e la correzione di continuità (le v.a. Xi sono a valori interi) si trova 110.5 − 625 · 1 110.5 − 125 5 = 8(−1.45) = 0.926 . P(S ≤ 110) ≃ 8 =8 q 10 4 25 625 b) Basta ripetere la costruzione di a): Xi = 1 se alla i-esima estrazione si ottiene 2 oppure 3 e Xi = 0 altrimenti. Ora le v.a. Xi sono di Bernoulli B(1, 25 ), hanno media 25 6 e varianza 25 . Dunque, sempre usando l’approssimazione normale con la correzione di continuità, 260.5 − 625 · 2 239.5 − 625 · 2 5 5 P(240 ≤ S ≤ 260) ≃ 8 −8 = q q 6 6 25 625 25 625 260.5 − 250 239.5 − 250 =8 −8 = 8(0.86) − 8(−0.86) = √ √ 6 · 25 6 · 25 = 0.80 − (1 − 0.80) = 0.6 . Esercizio 2. a) I possibili risultati del lancio di due dadi sono tutte le coppie (1, 1), (1, 2),. . . ,(6, 5),(6, 6), che sono in tutto 36. Tra di queste quelle che danno somma uguale a 7 sono (1, 6), (2, 5), (3, 4), (4, 3), (5, 2), (6, 1) che sono 6. Dato che siamo in una situazione di equiprobabilità (tutti questi possibili risultati 6 = 16 . sono equiprobabili, la probabilità sarà 36 b) Il numero di 7 in 360 lanci è una v.a. binomiale B(360, 16 ) (360 prove indipendenti ripetute in ciascuna delle quali il risultato d’interesse, cioè l’uscita del 7 si può verificare con probabilità 16 ). Il numero medio richiesto non è altro che la speranza matematica di questa v.a. e cioè 360 · 16 = 60. c) Indichiamo con S la v.a. ‘‘numero di volte che si ottiene 7’’. L’approssimazione normale (formula (3.34) degli appunti) dà 65.5 − 60 P(S > 66) = 1 − P(S ≤ 66.5) = 1 − 8 q = 1 − 8(0.92) = 1 − 0.82 = 0.18 5 36 360 3 d) Se riprendiamo il ragionamento di a), vediamo che solo le coppie (1, 1) e (6, 6) 2 1 corrispondono al conseguimento di 2 oppure 12. Dunque la probabilità richiesta è 36 = 18 . 1 e) Il numero di apparizioni di 2 oppure 12 segue una legge binomiale B(360, 8 ), che 1 ha media 360 · 18 = 20. f) Indichiamo con W la v.a. ‘‘numero di volte che si ottiene 2 oppure 12’’. L’approssimazione normale (formula (3.34) degli appunti) dà 26.5 − 20 P(W > 26) = 1 − P(W ≤ 26) = 1 − 8 q = 1 − 8(1.33) = 17 360 182 = 1 − 0.91 = 0.09 . Esercizio 3. Dire che giungono più di 380 chiamate in 12 ore è lo stesso che dire che la 380-esima chiamata arriva prima della fine della 12-esima ora (cioè prima del 720-esimo minuto). La probabilità richiesta è dunque P(S380 ≤ 720) dove S380 = T1 + . . . + T380 . Si può dunque applicare l’approssimazione normale (la formula (3.34) degli appunti) che dice che 720 − 380 · µ P(S380 ≤ 720) ≃ 8 . √ σ 380 Per applicarla occorre conoscere la media µ e la varianza σ 2 delle v.a. Ti . La media la sappiamo già = 2. Sappiamo che la media di una v.a. esponenziale di parametro λ è λ1 . Dunque qui λ = 21 . La varianza vale invece λ12 . Dunque σ 2 = 4 e σ = 2. L’approssimazione normale dà quindi P(S380 720 − 760 = 8(−1.026) = 1 − 0.847 = 0.153 . ≤ 720) ≃ 8 √ 2 380 Dire che giungono meno di 350 chiamate in 12 ore è lo stesso che dire che la 350-esima chiamata arriva dopo il 720-esimo minuto. Ovvero P(S350 720 − 700 = 1 − 8(0.513) = ≥ 720) = 1 − P(S350 ≤ 720) ≃ 1 − 8 √ 2 380 = 1 − 0.696 = 0.304 . Nota bene non si deve fare la correzione di continuità (vedi pag. 120-121 degli appunti) dato che le v.a. Ti non sono a valori continui. 4 Esercizio 4. a) Se la proporzione di pezzi che non superano il controllo è p = 0.03, allora il numero, X, di pezzi che non superano il controllo in un campione di 100 segue una legge binomiale B(100, 0.03). Dunque la probabilità di osservare almeno 4 pezzi scadenti è 1 − P(X = 0) + P(X = 1) + P(X = 2) + P(X = 3) Ora P(X P(X P(X P(X 100 = 0) = 0.975100 = 0.079 0 100 = 1) = 0.025 · 0.97599 = 100 · 0.03 · 0.97599 = 0.204 1 100 100 · 99 = 2) = 0.025 · 0.97599 = · 0.0252 · 0.97598 = 0.259 2 2 100 100 · 99 · 98 = 3) = 0.0253 · 0.97597 = · 0.0253 · 0.97597 = 0.217 3 6 e dunque P(X ≥ 4) = 1 − 0.079 − 0.204 − 0.259 − 0.217 = 0.241 L’approssimazione normale avrebbe dato P(X ≥ 4) = 1 − P(X ≤ 3) ≃ 1 − 8 3.5 − 2.5 = 0.261 √ 10 0.025 · 0.975 L’approssimazione normale qui non si può usare perché non è rispettata la regoletta np ≥ 5 (qui np = 100 · 0.025 = 2.5). b) Qui invece si ha np = 1000 · 0.025 = 25 e dunque è lecito usare l’approssimazione normale (e il calcolo esatto con le probabilità della binomiale sarebbe davvero lungo). Si ha dunque, indicando con Y il numero di pezzi che non superano il controllo in un campione di 1000, 30.5 − 25 = P(X ≥ 31) = 1 − P(X ≤ 30) ≃ 1 − 8 √ 0.025 · 0.975 · 1000 = 8(1.11) = 1 − 0.867 = 0.133 . Il calcolo esatto, con l’uso di un software opportuno avrebbe dato il valore 0.1338. Esercizio 5. Se poniamo Xi = n 1 0 se lo i-esimo individuo del campione è di tipo A se no 5 allora, per i dati del problema le v.a. X1 , . . . , Xn sono indipendenti e di legge B(1, 0.52) (la probabilità di scegliere proprio un individuo del gruppo A è proprio 0.52). Questa legge ha media 0.52 e varianza 0.52(1 − 0.52) = 0.52 · 0.48. a) Viene chiesto di calcolare la probabilità che sia X1 + . . . + X100 ≥ 50. Usando l’approssimazione normale (con la correzione di continuità) abbiamo P(X1 + . . . + X100 49.5 − 0.52 · 100 ≥ 50) = P(X1 + . . . + X100 ≥ 49.5) ≃ 1 − 8 = √ 10 0.52 · 0.48 = 1 − 8(−.5) = 0.69 . b) Gli stessi argomenti danno ora 199.5 − 0.52 · 400 = P(X1 +. . .+X400 ≥ 200) = P(X1 +. . .+X400 ≥ 199.5) ≃ 1−8 √ 20 0.52 · 0.48 = 1 − 8(−.85) = 0.80 . c) Avremmo, per n = 100, 50 − 0.52 · 100 P(X1 + . . . + X100 ≥ 50) ≃ 1 − 8 = 1 − 8(−.4) = 0.65 . √ 10 0.52 · 0.48 mentre per n = 400 P(X1 + . . . + X400 200 − 0.52 · 400 = 1 − 8(−.80) = 0.78 . ≥ 200) ≃ 1 − 8 √ 20 0.52 · 0.48 Confrontando con i valori della funzione di ripartizione delle leggi binomiali forniti da R, si vede che l’approssimazione normale con correzione di continuità dà dei valori praticamente esatti. 6