UNIVERSITÀ di ROMA TOR VERGATA

annuncio pubblicitario
UNIVERSITÀ di ROMA TOR VERGATA
Corso di Laurea Magistrale in Scienze della Nutrizione Umana
Corso di Statistica Medica, anno 2015-16
P.Baldi
Lista di esercizi 4, 11 febbraio 2016.
Esercizio 1 Una v.a. X segue una legge N(2, 4). Calcolare
a1) P(X ≤ 1).
a2) P(2 ≤ X ≤ 5).
a3) P(|X − 2| ≥ 3).
b) Supponiamo invece che X ∼ N(2, 1). Sapreste dire, prima di fare i conti, se le
quantità in a1), a2) a3) diventano più grandi o più piccole ? Poi comunque calcolatele.
c) Supponiamo invece che X ∼ N(2, 9). Sapreste dire, prima di fare i conti, se le
quantità in a1), a2) a3) diventano più grandi o più piccole ? Poi comunque calcolatele.
Esercizio 2 a) Si sa che un certo carattere in una popolazione è distribuito secondo una
legge normale N(10, 0.01). Dalla popolazione viene preso un campione di 400 individui e
indichiamo X1 , . . . , X400 i valori del carattere misurato sugli individui del campione.
a1) Qual è la probabilità che un individuo del campione presenti una misurazione del
carattere ≤ 9.8 ?
a2) Qual è la probabilità che vi sia almeno un individuo nel campione con una misurazione ≤ 9.8 ?
b) Viene invece fatta l’ipotesi che la popolazione sia in realtà composta da due sotto
popolazioni. Nella popolazione 1, che costituisce il 30%, il carattere ha una distribuzione
N(10, 0.01), mentre nella 2, che forma il 70%, il carattere ha una distribuzione N(10, 0.09).
In particolare, quindi, il carattere ha la stessa media nelle due sotto popolazioni, ma dispersioni diverse.
b1) Qual è la probabilità che un individuo del campione presenti una misurazione del
carattere ≤ 9.8 ?
b2) Qual è la probabilità che vi sia almeno un individuo nel campione con una misurazione ≤ 9.8 ?
Esercizio 3 Un generatore aleatorio produce numeri a caso indipendenti e con legge N (0, 1),
che indicheremo X1 , . . . , Xn .
a) Supponiamo n = 100. Qual è la probabilità che almeno uno di questi numeri sia
≥ 2.9 ?
b) Supponiamo sempre n = 100 e poniamo
X̄n =
1
(X1 + . . . + Xn ) .
n
1
Qual è la probabilità P(|X̄n | ≥ 0.1) ?
c) Quanto grande deve essere n perché la probabilità di osservare un valore ≥ 2.9 sia
più grande di 21 ?
d) Quanto grande deve essere n perché la probabilità P(|X̄n | ≥ 0.1) sia pù piccola di
1
100 ?
2
Soluzioni
Esercizio 1. Questo esercizio porta su applicazioni immediate delle proprietà della funzione
di ripartizione della legge N(0, 1), come riportate alle pagine 102–103 degli appunti e come
spiegato nell’Esempio 3.26.
L’osservazione importante è comunque che una v.a. N(µ, σ 2 ) si può sempre scrivere
X = σ Z + µ, dove Z ∼ N(0, 1). Questa relazione permette di ricondursi alle tavole della
N(0, 1). Nel nostro caso possiamo supporre quindi X = 2Z + 2, Z ∼ N(0, 1).
a 1) P(X ≤ 1) = P(2Z + 2 ≤ 1) = P(Z ≤ − 21 ) = 8(− 21 ). Il valore di 8 per
valori negativi non si trova. Ci si ricorda però che 8(− 21 ) = 1 − 8( 21 ). Le tavole danno
8( 21 ) = 0.69 e quindi P(X ≤ 1) = 1 − 0.69 = 0.31.
a2) L’osservazione importante qui è che P(2 ≤ X ≤ 5) = P(X ≤ 5) − P(X ≤ 2). Ora
P(X ≤ 5) = P(2Z + 2 ≤ 5) = P(Z ≤ 23 ) = 8(1.5) = 0.93
P(X ≤ 2) = P(2Z + 2 ≤ 2) = P(Z ≤ 0) = 8(0) =
1
2
e dunque P(2 ≤ X ≤ 5) = 0.93 − 0.5 = 0.43.
a3) Ricordiamo che dire |X − 2| > 3 vuole dire che o X − 2 > 3 oppure X − 2 < −3.
Dunque P(|X − 2| > 3) = P(X − 2 > 3) + P(X − 2 < −3). Ora
P(X − 2 < −3) = P(2Z + 2 − 2 < −3) = P(Z ≤ − 23 ) = 1 − P(Z ≤ 23 ) = 1 − 0.93 =
= 0.07
P(X − 2 > 3) = P(2Z + 2 − 2 > 3) = P(Z > 23 ) = 1 − P(Z ≤ 23 ) = 1 − 0.93 =
= 0.07
In conclusione P(|X − 2| > 3) = 0.07 + 0.07 = 0.14.
b) Sempre le stesse idee, solo che ora σ 2 = 1 e si deve scrivere X = Z + 2. Ora la
varianza è più piccola e quindi la v.a. X tenderà a concentrarsi su valori vicini alla media,
che è sempre uguale a 2. Dunque, intuitivamente, le quantità a1) e a3), che riguardano
probabilità di assumere valori lontano dalla media, dovrebbero diventare più piccole, mentre
a2) dovrebbe diventare più grande. Verifichiamo.
b1)
P(X ≤ 1) = P(Z + 2 ≤ 1) = P(Z ≤ −1) = 8(−1) = 1 − 8(1) = 1 − 0.84 = 0.16
b2)
P(X ≤ 5) = P(Z + 2 ≤ 5) = P(Z ≤ 3) = 8(3) = 0.999
P(X ≤ 2) = P(Z + 2 ≤ 2) = P(Z ≤ 0) = 8(0) =
3
1
2
b3)
P(X − 2 < −3) = P(Z + 2 − 2 < −3) = P(Z ≤ −3) = 1 − P(Z ≤ 3) = 1 − 0.999 =
= 0.001
P(X − 2 > 3) = P(Z + 2 − 2 > 3) = P(Z > 3) = 1 − P(Z ≤ 3) = 1 − 0.999 =
= 0.001
In conclusione P(|X − 2| > 3) = 0.001 + 0.001 = 0.002.
c) Ora σ 2 = 9 e si deve scrivere X = 3Z + 2. Dato che ora la varianza è più grande,
ripetendo i ragionamenti fatti per b), dovrebbe accadere il contrario: a1) e a3) daranno
probabilità pù grandi, a2) una probabilità più piccola.
c1)
P(X ≤ 1) = P(3Z + 2 ≤ 1) = P(Z ≤ − 13 ) = 8(− 13 ) = 1 − 8( 13 ) = 1 − 0.625 = 0.375
c2)
P(X ≤ 5) = P(3Z + 2 ≤ 5) = P(Z ≤ 1) = 8(1) = 0.84
P(X ≤ 2) = P(3Z + 2 ≤ 2) = P(Z ≤ 0) = 8(0) =
1
2
c3)
P(X − 2 < −3) = P(3Z + 2 − 2 < −3) = P(Z ≤ −1) = 1 − P(Z ≤ 1) = 1 − 0.84 =
= 0.16
P(X − 2 > 3) = P(3Z + 2 − 2 > 3) = P(Z > 1) = 1 − P(Z ≤ 1) = 1 − 0.84 =
= 0.16
e quindi P(|X − 2| > 3) = 0.16 + 0.16 = 0.32.
Esercizio 2. Se indichiamo con X1 una delle misurazioni, allora possiamo scrivere X1 =
0.1Z + 10 (0.1 è la radice quadrata di 0.01). Dunque
a1)
P(X1 ≤ 9.8) = P(0.1Z + 10 ≤ 9.8) = P(Z ≤ −2) = 1 − 8(2) = 1 − 0.977 = 0.023
a2) La probabilità che almeno una delle misurazioni sia ≤ 9.8 sarà uguale a 1 meno la
probabilità che tutte le misurazioni siano > 9.8, cioè
1 − P(X1 > 9.8, . . . , X400 > 9.8)
Dato che si possono considerare le misurazioni indipendenti,
= 1−P(X1 > 9.8) . . . P(X400 > 9.8) = 1−P(X1 > 9.8)400 = 1−(1−P(X1 ≤ 9.8))400 =
= 1 − 0.977400 = 1 − 0.0001 = 0.9999
4
b) Indichiamo con A1 l’evento ‘‘viene scelto un individuo della popolazione 1’’ e con
A2 il corrispondente evento per la popolazione 2. Sappiamo che per un individuo della
popolazione 1 X1 ∼ N(10, 0.01), ovvero X = 0.1Z + 10 dove Z ∼ N(0, 1). Dunque
P(X1 ≤ 9.8 | A1 ) = P(0.1Z + 10 ≤ 9.8) = 0.023
(già calcolata in a1)). Invece per un√individuo della popolazione 2 X1 ∼ N(10, 0.09) ovvero
X1 ∼ 0.3Z + 10 (dato che 0.3 = 0.09). Dunque
P(X1 ≤ 9.8 | A2 ) = P(0.3Z + 10 ≤ 9.8) = P(Z ≤ − 23 ) = 1 − P(Z ≤ 23 ) =
= 1 − 0.745 = 0.255
Quindi con la formula delle probabilità totali
P(X1 ≤ 9.8) = P(X1 ≤ 9.8 | A1 )P(A1 + P(X1 ≤ 9.8 | A2 )P(A2 ) =
= 0.023 · 0.3 + 0.255 · 0.7 = 0.185
b2) Si possono ripetere i ragionamenti fatti in a2), cioè la probabilità che ci sia almeno
una misurazione inferiore a 9.8 è uguale a
1 − (1 − P(X1 ≤ 9.8))400
solo che ora P(X1 ≤ 9.8) = 0.185. Arriviamo dunque all’espressione
1 − (1 − 0.185)400 = 1 − 0.815400
che è praticamente uguale a 1 (0.815400 = 2.9 10−36 ).
• Un errore possibile è quello di giungere a dare come risposta a b2) la probabilità
1 − 0.3(1 − 0.977)400 − 0.7(1 − 875)400
(sbagliata)
In realtà questa sarebbe la risposta giusta se si fosse supposto che con probabilità 30% tutti
gl’individui fossero della popolazione 1 e con probabilità 70% tutti gl’individui fossero
della popolazione 2.
Esercizio 3. a) Conviene calcolare prima la probabilità che tutti i valori X1 , . . . , X100 sian
più piccoli di 2.9. La probabilità che uno di questi sia ≤ 2.9 è uguale a (vedi le tavole)
0.99864. Poiché gli eventi {X1 ≤ 2.9},. . . , {X1 00 ≤ 2.9} sono indipendenti, si ha
P(X1 ≤ 2.9, . . . , X1 00 ≤ 2.9) = P(X1 ≤ 2.9) . . . P(X1 00 ≤ 2.9) = 0.99864100 = 0.87
e dunque la probabilità che uno almeno dei valori osservati sia più grande di 2.9 è 1−0.87 =
0.13.
5
b) La v.a. X1 + . . . + Xn segue una legge N(0, n) e la X̄n quindi è N(0, n1 ), ovvero
1
1
N(0, 100
) in questo caso. Sappiamo che questo vuole dire che X̄n = 10
Z, dove Z è
N(0, 1). Dunque
1
Z| ≥ 0.1) = P(|Z| ≥ 1) =
P(|X̄n | ≥ 0.1) = P(| 10
= 1 − (28(1) − 1) = 2(1 − 8(1)) = 2(1 − 0.84134) = 0.317
c) La probabilità di avere almeno una osservazione più grande di 2.9 è (ripetendo
l’argomentazione di a))
1 − 0.99864n .
Perché questa quantità si ≥
prendendo i logaritmi,
1
2,
cioè 1 − 0.99864n ≥
1
2,
deve essere 0.99864n ≤
1
2
e,
1
2
e quindi, dividendo ambo i membri per log 0.99864, si trova (vedi nota sotto)
n log 0.99864 ≤ log
log 21
= 509.34
n≥
log 0.99864
Occorre quindi un campione di almeno n = 510 valori.
d) Abbiamo già osservato che X̄n ∼ N(0, n1 ) e dunque si può scrivere X̄n =
Z ∼ N(0, 1). Dunque
√1
n
Z, con
√
√
P(|X̄n | ≥ 0.1) = P(| √1n Z| ≥ 0.1) = P(|Z| ≥ 0.1 · n) = 1 − (28(0.1 · n) − 1) =
√
= 2(1 − 8(0.1 · n))
Se vogliamo che questa quantità sia ≤
1
100 ,
dovrà dunque essere
2(1 − 8(0.1 ·
ovvero 1 − 8(0.1 ·
√
n) ≤
1
200 ,
8(0.1 ·
√
√
1
n)) ≤
100
cioè
n) ≥ 1 −
1
= 1 − 0.005 = 0.995
200
Uno √
sguardo alle tavole dice che 8(x) = 0.995 per x = 2.58. Dunque deve essere
0.1 · n ≥ 2.58 e dunque
n ≥ 25.82 = 665.64
ovvero deve essere n ≥ 666.
6
• Attenzione: in c) dalla relazione
n log 0.99864 ≤ log
abbiamo ricavato
1
2
log 21
n≥
= 509.34
log 0.99864
cioè ≥ e non ≤. Questo perché il numero log 0.99864 è negativo, essendo il logaritmo di
un numero più piccolo di 1. E quando si dividono ambo i membri per una quantità negativa
bisogna cambiare il verso della disuguaglianza. (anche log 21 è un numero negativo).
Questa è una cosa a cui bisogna fare attenzione: una probabilità è infatti sempre più
piccola di 1 e il suo logaritmo è quindi sempre negativo, anche se a prima vista ‘‘non si
vede’’.
7
Scarica