testo dell`esame scritto del 14 ottobre 2016

UNIVERSITÀ di ROMA TOR VERGATA
Corso di Laurea Magistrale in Scienza della Nutrizione Umana
Corso di Statistica Medica, anno 2015-16
P.Baldi
Esame del 14 ottobre 2016
Le risposte non motivate non sono prese in considerazione
Esercizio 1 La misurazione di un certo carattere in un campione di 23 individui ha prodotto
i valori
2, 3, 5, 5, 6, 7, 8, 8, 8, 8, 9, 10, 11, 11, 11, 11, 11, 12, 12, 12, 13, 14, 17
Quanto vale la media di queste misurazioni ? Quanto vale la mediana ? Calcolare il primo
e terzo quartile.
Esercizio 2 Una popolazione di coleotteri è composta da due gruppi, A e B, simili tra loro.
Si sa che le proporzioni delle due sottofamiglie sono
A : 20%,
B : 80% .
Inoltre nel gruppo A i coleotteri hanno una colorazione rossa con una proporzione del 50%,
mentre una colorazione simile è presente nel gruppo B nella proporzione del 20%.
a) Un coleottero viene scelto a caso nella popolazione. Qual è la probabilità che presenti
la colorazione rossa ?
b) Qual è la probabilità che un individuo che presenta la colorazione rossa appartenga
al gruppo A ? È più probabile che appartenga ad A o a B ?
Esercizio 3 a) Si sa che la lunghezza degli insetti di una certa popolazione segue una
legge normale N(10, 1). Dalla popolazione viene preso un campione di 100 individui e
indichiamo X1 , . . . , X100 i valori delle lunghezze degli insetti del campione.
a) Qual è la probabilità che un insetto del campione presenti una lunghezza ≤ 8 ?
b) Qual è la probabilità che tutti gli insetti del campione abbiano una lunghezza ≥ 8 ?
c) Qual è la probabilità che vi sia almeno un insetto nel campione con una misurazione
≤ 8?
d) Qual è la probabilità che la media delle lunghezze degli insetti del campione
X=
sia ≤ 9.8 ?
1
(X1 + . . . + X100 )
n
Esercizio 4 a) La società DemoScop effettua un sondaggio per conto del partito A. Su 1000
individui intervistati 527 si sono dichiarati a favore del partito A. Questo dato permette di
respingere l’ipotesi che la proporzione di votanti per A nella popolazione sia inferiore a 21
al livello 5% ? E al livello 1% ?
b) Come cambierebbe la risposta se il sondaggio fosse stato su 2000 intervistati di cui
1054 si sono dichiarati a favore di A ?
Soluzioni
Esercizio 1. La media è uguale alla somma
2+3+5+5+6+7+8+8+8+8+9+10+11+11+11+11+11+12+12+12+13+14+17
diviso per 23 che fa 9.3. La mediana è la 12esima osservazione e vale 10. Per il calcolo del
primo quantile, abbiamo 23 osservazioni e, dato che 24
4 = 6, si tratta della sesta osservazione,
cioè 7. Allo stesso modo per il terzo quartile, abbiamo 24 43 = 18 e dunque si tratta della
18esima osservazione, che vale 12.
Esercizio 2. Indichiamo con R l’evento ‘‘il coleottero scelto a caso presenta la colorazione
rossa’’, con A l’evento ‘‘il coleottero scelto a caso appartiene alla popolazione A’’ e con B
l’analogo evento per la popolazione B. I dati del problema dicono che
P(A) = 0.2, P(B) = 0.8 .
Inoltre dire che i coleotteri della popolazione A presentano la colorazione rossa con probabilità 0.5 si esprime dicendo che P(R | A) = 0.5. Analogamente si ha P(R | B) = 0.2.
a) La probabilità di R si calcola ora facilmente con la formula delle probabilità totali
P(R) = P(A)P(R | A) + P(B)P(R | B) = 0.2 · 0.5 + 0.8 · 0.2 = 0.26.
b) Si tratta di calcolare la probabilità condizionale di A dato R, cioè P(A | R). Questo
si fa con la formula di Bayes
P(A | R) =
0.2 · 0.5
0.1
P(A)P(R | A)
=
=
= 0.38 .
P(R)
0.26
0.26
Invece P(B | R) = 1 − P(A | R) = 0.62: è più probabile che il coleottero con la colorazione
rossa provenga dalla popolazione B.
Esercizio 3. Se indichiamo con X1 una delle misurazioni, allora possiamo scrivere X1 =
Z + 10 dove Z ∼ N(0, 1). Dunque
a)
P(X1 ≤ 8) = P(Z + 10 ≤ 8) = P(Z ≤ −2) = 1 − 8(2) = 1 − 0.977 = 0.023 = 2.3% .
b) Dobbiamo calcolare la probabilità dell’evento
{X1 > 8, . . . , X100 > 8} .
Poiché gli eventi {X1 > 8}, . . . , {X100 > 8} sono indipendenti, abbiamo
P(X1 > 8, . . . , X100 > 8) = P(X1 > 8) . . . P(X100 > 8) = P(X1 > 8)100 .
Poiché P(X100 > 8) = 1 − (X100 ≤ 8) = 1 − 0.023 = .977, abbiamo
P(X1 > 8, . . . , X100 > 8) = .977100 = 0.097 = 9.7% .
c) La probabilità che almeno una delle misurazioni sia ≤ 8 sarà uguale a 1 meno la
probabilità che tutte le misurazioni siano > 8, cioè 1 − 0.097 = 0.903 = 90.3%.
d) Usando le proprietà delle leggi normali, sappiamo che la media campionaria X segue
1
una legge N(10, 100
). Dunque X ∼ 0.1Z + 10 dove Z ∼ N(0, 1) (0.1 è la radice quadrata
1
). Dunque
di 100
P(X ≤ 9.8) = P(0.1Z + 10 ≤ 9.8) = P(Z ≤ −2) = 0.023 = 2.3% .
Esercizio 4. a) Se indichiamo con Xi la risposta dello i-esimo intervistato (Xi = 1 se a
favore di A, 0 se no) allora il numero totale di intervistati a favore di A sarebbe S = X1 +
. . . + X1000 . Nell’ipotesi che il partito A abbia il 50% di votanti a favore nella popolazione,
le v.a. Xi sarebbero binomiali B(1, 21 ) ed avrebbero dunque media uguale a 21 e varianza 41 .
La v.a. S seguirebbe dunque una legge binomiale B(1000, 21 ) e l’approssimazione normale
(con correzione di continuità) darebbe
S − 1000 1
526.5 − 1000 21 2
P(S ≥ 527) = P q
≥
=
q
1
1
4 1000
4 1000
S − 1000 1
526.5 − 1000 21 2
≤
.
=1−P q
q
1
1
4 1000
4 1000
Poiché
526.5 − 1000 21
= 1.67
q
1
1000
4
avremmo dunque
P(S ≥ 527) ' 1 − 8(1.67) = 1 − 0.952 = 0.048 = 4.8%
e dunque l’ipotesi che la proporzione di votanti nella popolazione sia inferiore a
essere respinta al livello 5% ma non al livello 1%.
b) Si deve ripetere il ragionamento di a) con i nuovi numeri:
S − 2000 1
1053.5 − 2000 21 2
P(S ≥ 1054) = P q
≥
=
q
1
1
4 2000
4 2000
=1−P
S − 2000 1
1053.5 − 2000 21 2
≤
.
q
q
1
1
4 2000
4 2000
1
2
può
Poiché
1053.5 − 2000 21
= 2.39
q
1
4 2000
avremmo dunque
P(S ≥ 1054) ' 1 − 8(2.39) = 1 − 0.991 = 0.009 = 0.9% .
Ora l’ipotesi può essere respinta anche al livello 1%.