UNIVERSITÀ di ROMA TOR VERGATA Corso di Laurea Magistrale in Scienze della Nutrizione Umana Corso di Statistica Medica, anno 2015-16 P.Baldi Lista di esercizi 4, 11 febbraio 2016. Esercizio 1 Una v.a. X segue una legge N(2, 4). Calcolare a1) P(X ≤ 1). a2) P(2 ≤ X ≤ 5). a3) P(|X − 2| ≥ 3). b) Supponiamo invece che X ∼ N(2, 1). Sapreste dire, prima di fare i conti, se le quantità in a1), a2) a3) diventano più grandi o più piccole ? Poi comunque calcolatele. c) Supponiamo invece che X ∼ N(2, 9). Sapreste dire, prima di fare i conti, se le quantità in a1), a2) a3) diventano più grandi o più piccole ? Poi comunque calcolatele. Esercizio 2 a) Si sa che un certo carattere in una popolazione è distribuito secondo una legge normale N(10, 0.01). Dalla popolazione viene preso un campione di 400 individui e indichiamo X1 , . . . , X400 i valori del carattere misurato sugli individui del campione. a1) Qual è la probabilità che un individuo del campione presenti una misurazione del carattere ≤ 9.8 ? a2) Qual è la probabilità che vi sia almeno un individuo nel campione con una misurazione ≤ 9.8 ? b) Viene invece fatta l’ipotesi che la popolazione sia in realtà composta da due sotto popolazioni. Nella popolazione 1, che costituisce il 30%, il carattere ha una distribuzione N(10, 0.01), mentre nella 2, che forma il 70%, il carattere ha una distribuzione N(10, 0.09). In particolare, quindi, il carattere ha la stessa media nelle due sotto popolazioni, ma dispersioni diverse. b1) Qual è la probabilità che un individuo del campione presenti una misurazione del carattere ≤ 9.8 ? b2) Qual è la probabilità che vi sia almeno un individuo nel campione con una misurazione ≤ 9.8 ? Esercizio 3 Un generatore aleatorio produce numeri a caso indipendenti e con legge N (0, 1), che indicheremo X1 , . . . , Xn . a) Supponiamo n = 100. Qual è la probabilità che almeno uno di questi numeri sia ≥ 2.9 ? b) Supponiamo sempre n = 100 e poniamo X̄n = 1 (X1 + . . . + Xn ) . n 1 Qual è la probabilità P(|X̄n | ≥ 0.1) ? c) Quanto grande deve essere n perché la probabilità di osservare un valore ≥ 2.9 sia più grande di 21 ? d) Quanto grande deve essere n perché la probabilità P(|X̄n | ≥ 0.1) sia pù piccola di 1 100 ? 2 Soluzioni Esercizio 1. Questo esercizio porta su applicazioni immediate delle proprietà della funzione di ripartizione della legge N(0, 1), come riportate alle pagine 102–103 degli appunti e come spiegato nell’Esempio 3.26. L’osservazione importante è comunque che una v.a. N(µ, σ 2 ) si può sempre scrivere X = σ Z + µ, dove Z ∼ N(0, 1). Questa relazione permette di ricondursi alle tavole della N(0, 1). Nel nostro caso possiamo supporre quindi X = 2Z + 2, Z ∼ N(0, 1). a 1) P(X ≤ 1) = P(2Z + 2 ≤ 1) = P(Z ≤ − 21 ) = 8(− 21 ). Il valore di 8 per valori negativi non si trova. Ci si ricorda però che 8(− 21 ) = 1 − 8( 21 ). Le tavole danno 8( 21 ) = 0.69 e quindi P(X ≤ 1) = 1 − 0.69 = 0.31. a2) L’osservazione importante qui è che P(2 ≤ X ≤ 5) = P(X ≤ 5) − P(X ≤ 2). Ora P(X ≤ 5) = P(2Z + 2 ≤ 5) = P(Z ≤ 23 ) = 8(1.5) = 0.93 P(X ≤ 2) = P(2Z + 2 ≤ 2) = P(Z ≤ 0) = 8(0) = 1 2 e dunque P(2 ≤ X ≤ 5) = 0.93 − 0.5 = 0.43. a3) Ricordiamo che dire |X − 2| > 3 vuole dire che o X − 2 > 3 oppure X − 2 < −3. Dunque P(|X − 2| > 3) = P(X − 2 > 3) + P(X − 2 < −3). Ora P(X − 2 < −3) = P(2Z + 2 − 2 < −3) = P(Z ≤ − 23 ) = 1 − P(Z ≤ 23 ) = 1 − 0.93 = = 0.07 P(X − 2 > 3) = P(2Z + 2 − 2 > 3) = P(Z > 23 ) = 1 − P(Z ≤ 23 ) = 1 − 0.93 = = 0.07 In conclusione P(|X − 2| > 3) = 0.07 + 0.07 = 0.14. b) Sempre le stesse idee, solo che ora σ 2 = 1 e si deve scrivere X = Z + 2. Ora la varianza è più piccola e quindi la v.a. X tenderà a concentrarsi su valori vicini alla media, che è sempre uguale a 2. Dunque, intuitivamente, le quantità a1) e a3), che riguardano probabilità di assumere valori lontano dalla media, dovrebbero diventare più piccole, mentre a2) dovrebbe diventare più grande. Verifichiamo. b1) P(X ≤ 1) = P(Z + 2 ≤ 1) = P(Z ≤ −1) = 8(−1) = 1 − 8(1) = 1 − 0.84 = 0.16 b2) P(X ≤ 5) = P(Z + 2 ≤ 5) = P(Z ≤ 3) = 8(3) = 0.999 P(X ≤ 2) = P(Z + 2 ≤ 2) = P(Z ≤ 0) = 8(0) = 3 1 2 b3) P(X − 2 < −3) = P(Z + 2 − 2 < −3) = P(Z ≤ −3) = 1 − P(Z ≤ 3) = 1 − 0.999 = = 0.001 P(X − 2 > 3) = P(Z + 2 − 2 > 3) = P(Z > 3) = 1 − P(Z ≤ 3) = 1 − 0.999 = = 0.001 In conclusione P(|X − 2| > 3) = 0.001 + 0.001 = 0.002. c) Ora σ 2 = 9 e si deve scrivere X = 3Z + 2. Dato che ora la varianza è più grande, ripetendo i ragionamenti fatti per b), dovrebbe accadere il contrario: a1) e a3) daranno probabilità pù grandi, a2) una probabilità più piccola. c1) P(X ≤ 1) = P(3Z + 2 ≤ 1) = P(Z ≤ − 13 ) = 8(− 13 ) = 1 − 8( 13 ) = 1 − 0.625 = 0.375 c2) P(X ≤ 5) = P(3Z + 2 ≤ 5) = P(Z ≤ 1) = 8(1) = 0.84 P(X ≤ 2) = P(3Z + 2 ≤ 2) = P(Z ≤ 0) = 8(0) = 1 2 c3) P(X − 2 < −3) = P(3Z + 2 − 2 < −3) = P(Z ≤ −1) = 1 − P(Z ≤ 1) = 1 − 0.84 = = 0.16 P(X − 2 > 3) = P(3Z + 2 − 2 > 3) = P(Z > 1) = 1 − P(Z ≤ 1) = 1 − 0.84 = = 0.16 e quindi P(|X − 2| > 3) = 0.16 + 0.16 = 0.32. Esercizio 2. Se indichiamo con X1 una delle misurazioni, allora possiamo scrivere X1 = 0.1Z + 10 (0.1 è la radice quadrata di 0.01). Dunque a1) P(X1 ≤ 9.8) = P(0.1Z + 10 ≤ 9.8) = P(Z ≤ −2) = 1 − 8(2) = 1 − 0.977 = 0.023 a2) La probabilità che almeno una delle misurazioni sia ≤ 9.8 sarà uguale a 1 meno la probabilità che tutte le misurazioni siano > 9.8, cioè 1 − P(X1 > 9.8, . . . , X400 > 9.8) Dato che si possono considerare le misurazioni indipendenti, = 1−P(X1 > 9.8) . . . P(X400 > 9.8) = 1−P(X1 > 9.8)400 = 1−(1−P(X1 ≤ 9.8))400 = = 1 − 0.977400 = 1 − 0.0001 = 0.9999 4 b) Indichiamo con A1 l’evento ‘‘viene scelto un individuo della popolazione 1’’ e con A2 il corrispondente evento per la popolazione 2. Sappiamo che per un individuo della popolazione 1 X1 ∼ N(10, 0.01), ovvero X = 0.1Z + 10 dove Z ∼ N(0, 1). Dunque P(X1 ≤ 9.8 | A1 ) = P(0.1Z + 10 ≤ 9.8) = 0.023 (già calcolata in a1)). Invece per un√individuo della popolazione 2 X1 ∼ N(10, 0.09) ovvero X1 ∼ 0.3Z + 10 (dato che 0.3 = 0.09). Dunque P(X1 ≤ 9.8 | A2 ) = P(0.3Z + 10 ≤ 9.8) = P(Z ≤ − 23 ) = 1 − P(Z ≤ 23 ) = = 1 − 0.745 = 0.255 Quindi con la formula delle probabilità totali P(X1 ≤ 9.8) = P(X1 ≤ 9.8 | A1 )P(A1 + P(X1 ≤ 9.8 | A2 )P(A2 ) = = 0.023 · 0.3 + 0.255 · 0.7 = 0.185 b2) Si possono ripetere i ragionamenti fatti in a2), cioè la probabilità che ci sia almeno una misurazione inferiore a 9.8 è uguale a 1 − (1 − P(X1 ≤ 9.8))400 solo che ora P(X1 ≤ 9.8) = 0.185. Arriviamo dunque all’espressione 1 − (1 − 0.185)400 = 1 − 0.815400 che è praticamente uguale a 1 (0.815400 = 2.9 10−36 ). • Un errore possibile è quello di giungere a dare come risposta a b2) la probabilità 1 − 0.3(1 − 0.977)400 − 0.7(1 − 875)400 (sbagliata) In realtà questa sarebbe la risposta giusta se si fosse supposto che con probabilità 30% tutti gl’individui fossero della popolazione 1 e con probabilità 70% tutti gl’individui fossero della popolazione 2. Esercizio 3. a) Conviene calcolare prima la probabilità che tutti i valori X1 , . . . , X100 sian più piccoli di 2.9. La probabilità che uno di questi sia ≤ 2.9 è uguale a (vedi le tavole) 0.99864. Poiché gli eventi {X1 ≤ 2.9},. . . , {X1 00 ≤ 2.9} sono indipendenti, si ha P(X1 ≤ 2.9, . . . , X1 00 ≤ 2.9) = P(X1 ≤ 2.9) . . . P(X1 00 ≤ 2.9) = 0.99864100 = 0.87 e dunque la probabilità che uno almeno dei valori osservati sia più grande di 2.9 è 1−0.87 = 0.13. 5 b) La v.a. X1 + . . . + Xn segue una legge N(0, n) e la X̄n quindi è N(0, n1 ), ovvero 1 1 N(0, 100 ) in questo caso. Sappiamo che questo vuole dire che X̄n = 10 Z, dove Z è N(0, 1). Dunque 1 Z| ≥ 0.1) = P(|Z| ≥ 1) = P(|X̄n | ≥ 0.1) = P(| 10 = 1 − (28(1) − 1) = 2(1 − 8(1)) = 2(1 − 0.84134) = 0.317 c) La probabilità di avere almeno una osservazione più grande di 2.9 è (ripetendo l’argomentazione di a)) 1 − 0.99864n . Perché questa quantità si ≥ prendendo i logaritmi, 1 2, cioè 1 − 0.99864n ≥ 1 2, deve essere 0.99864n ≤ 1 2 e, 1 2 e quindi, dividendo ambo i membri per log 0.99864, si trova (vedi nota sotto) n log 0.99864 ≤ log log 21 = 509.34 n≥ log 0.99864 Occorre quindi un campione di almeno n = 510 valori. d) Abbiamo già osservato che X̄n ∼ N(0, n1 ) e dunque si può scrivere X̄n = Z ∼ N(0, 1). Dunque √1 n Z, con √ √ P(|X̄n | ≥ 0.1) = P(| √1n Z| ≥ 0.1) = P(|Z| ≥ 0.1 · n) = 1 − (28(0.1 · n) − 1) = √ = 2(1 − 8(0.1 · n)) Se vogliamo che questa quantità sia ≤ 1 100 , dovrà dunque essere 2(1 − 8(0.1 · ovvero 1 − 8(0.1 · √ n) ≤ 1 200 , 8(0.1 · √ √ 1 n)) ≤ 100 cioè n) ≥ 1 − 1 = 1 − 0.005 = 0.995 200 Uno √ sguardo alle tavole dice che 8(x) = 0.995 per x = 2.58. Dunque deve essere 0.1 · n ≥ 2.58 e dunque n ≥ 25.82 = 665.64 ovvero deve essere n ≥ 666. 6 • Attenzione: in c) dalla relazione n log 0.99864 ≤ log abbiamo ricavato 1 2 log 21 n≥ = 509.34 log 0.99864 cioè ≥ e non ≤. Questo perché il numero log 0.99864 è negativo, essendo il logaritmo di un numero più piccolo di 1. E quando si dividono ambo i membri per una quantità negativa bisogna cambiare il verso della disuguaglianza. (anche log 21 è un numero negativo). Questa è una cosa a cui bisogna fare attenzione: una probabilità è infatti sempre più piccola di 1 e il suo logaritmo è quindi sempre negativo, anche se a prima vista ‘‘non si vede’’. 7