UNIVERSITÀ di ROMA TOR VERGATA
Corso di Laurea Magistrale in Scienze della Nutrizione Umana
Corso di Statistica Medica, anno 2015-16
P.Baldi
Lista di esercizi 3, 4 febbraio 2016.
Esercizio 1 Una popolazione d’insetti è composta da due gruppi, A e B, simili tra loro. Si
sa che le proporzioni delle due sottofamiglie sono
A : 30%,
B : 70%
Inoltre nel gruppo A gl’individui hanno una colorazione rossa con una proporzione del 55%,
mentre una colorazione simile è presente nel gruppo B nella proporzione del 20%.
a) Un individuo viene scelto a caso nella popolazione. Qual è la probabilità che presenti
la colorazione rossa?
b) Qual è la probabilità che un individuo che presenta la colorazione rossa appartenga
al gruppo A ? È più probabile che appartenga ad A o a B ?
Esercizio 2 Una scatola contiene 10 monete; 8 di queste sono equilibrate, mentre le altre 2
danno testa (T ) con probabilità 23 e croce (C) con probabilità 13 .
a) Una moneta viene scelta a caso e lanciata n = 10 volte.
a1) Qual è la probabilità di ottenere 6 volte testa.
a2) Qual è la probabilità che la moneta sia una di quelle equilibrate sapendo che in
10 lanci si è ottenuto 6 volte testa? È più probabile che sia una moneta truccata oppure
equilibrata?
b) Rispondere alle stesse domande di a) supponendo che la moneta è stata lanciata 100
volte e che si è ottenuto 60 volte testa.
Esercizio 3 Due variabili X e Y sono state misurate su 5 individui ottenendo le misurazioni
seguenti:
X 0 1
3 4
Y
3 0 -2 -3
a) Qual è il coefficiente di correlazione tra le due variabili ?
b) Trovare la retta di regressione di Y su X;
c) Le due variabili appaiono dipendere una dall’altra? Che tipo di dipendenza ?
Esercizio 4 Si sa che in una popolazione le proporzioni dei 4 gruppi sanguigni sono
0
47%
A
B
38%
10%
AB
3%
(si tratta delle proporzioni dell’Australia). Vengono scelti a caso 4 individui.
a) Qual è la probabilità di osservare esattamente un individuo di tipo 0 ed uno di tipo
A?
b) Qual è la probabilità di osservare due individui di tipo 0 e due di tipo A ?
c) Qual è la probabilità che nessuno dei 4 sia di tipo B oppure AB ?
Soluzioni
Esercizio 1. Indichiamo con R l’evento ‘‘l’insetto scelto a caso presenta la colorazione
rossa’’, con A l’evento ‘‘l’insetto scelto a caso appartiene alla popolazione A’’ e con B
l’analogo evento per la popolazione B. I dati del problema dicono che
P(A) = 0.3, P(B) = 0.7 .
Inoltre dire che gl’insetti della popolazione A presentano la colorazione rossa con probabilità
0.55 si esprime dicendo che P(R | A) = 0.55. Analogamente si ha P(R | B) = 0.2. a) La
probabilità di R si calcola ora facilmente con la formula delle probabilità totali
P(R) = P(A)P(R | A) + P(B)P(R | B) = 0.3 · 0.55 + 0.7 · 0.2 = 0.305.
b) Si tratta di calcolare la probabilità condizionale di A dato R, cioè P(A | R). Questo
si fa con la formula di Bayes
P(A | R) =
P(A)P(R | A)
0.3 · 0.55
0.165
=
=
= 0.541.
P(R)
0.305
0.305
Invece P (B | R) = 1 − P (A | R) = 0.459: è più probabile che l’insetto con la colorazione
rossa provenga dalla popolazione A.
Esercizio 2. La parte iniziale di questo esercizio (la modellizzazione) è del tutto simile
a quella dell’esercizio precedente. Occorre introdurre due eventi ‘‘si è scelta una moneta
equilibrata’’ (chiamiamolo E) e ‘‘si è scelta una moneta che non è equilibrata’’ (chiamiamolo N ). Indichiamo poi con A l’evento ‘‘in 10 lanci si sono ottenute 6 teste’’. I dati del
problema c’informano che
P(E) =
4
8
= ,
10
5
P(N ) =
2
1
= .
10
5
Se la moneta prescelta è equilibrata, allora la probabilità di ottenere 6 teste in 10 lanci è data
dalla legge binomiale B(10, 21 ) (10 prove ripetute indipendenti con probabilità 21 di avere
testa in una singola prova). Più precisamente la probabilità di avere 6 teste in 10 lanci per
la moneta equilibrata è
10 1 10
10 1 6
1 4
=
1−
6
6
2
2
2
Dunque
10 1 10
P(A | E) =
2
6
Se invece la moneta non è equilibrata, la probabilità di avere 6 teste in 10 lanci sarà data dalla
legge binomiale B(10, 23 ) (sempre 10 prove ripetute indipendenti ma ora con probabilità 23
di avere testa in una singola prova). Dunque
10 2 6
1 4
P(A | N ) =
1−
6
3
3
a1) Per la formula delle probabilità totali la probabilità di avere 6 teste in 10 lanci risulta
essere
P(A) = P(E)P(A | E) + P(N )P(A | N ) =
4
4 10 1 10 1 10 2 6 1 4
1
+
= · 0.205 + · 0.227
1−
5 6
2
5 6
3
3
5
5
= 0.21
• Attenzione all’errore possibile: se si sceglie a caso una moneta e la si lancia una
volta la probabilità di ottenere testa è 45 21 + 15 23 = 0.53. Potrebbe venire la tentazione di dire
che il numero di teste in 10 lanci della moneta sia descritto da una binomiale B(10, 0.53),
ovvero che sia
10
P(A) =
0.536 0.474 (sbagliata!)
6
In effetti questa sarebbe la risposta giusta se facessimo i 10 lanci estraendo ad ogni lancio
una moneta che poi rimettiamo nell’urna.
a2) Dobbiamo calcolare P(E | A). Al solito la formula di Bayes dà
P(E | A) =
P(E)P(A | E)
=
P(A)
10
4 10 1
5 6
2
0.21
=
4
5
· 0.205
= 0.78
0.21
Poiché P(N | A) = 1 − P(E | A) = 0.32, è più probabile che sia una moneta equilibrata.
b1) Stesso conto che in a1), solo che adesso, se indichiamo con B l’evento ‘‘in 100 lanci
la moneta ha dato testa 60 volte’’. Abbiamo
100 1 100
P(B | E) =
2
60
dato che il numero di teste in 100 lanci viene descritto da una legge binomiale B(100, 21 ).
Invece si avrà
100 2 60 1 40
P(B | N ) =
60
3
3
perché se la moneta è truccata il numero di teste in 100 lanci seguirà una legge B(100, 23 ).
Dunque
4 100 1 100 1 100 2 60 1 40
+
P(B) = P(E)P(B | E) + P(N )P(B | N ) =
5 60
2
5 60
3
3
Questo calcolo richiede attenzione anche con una calcolatrice. Il risultato comunque è
4
1
5 · 0.011 + 5 · 0.031 = 0.015.
b2) La formula di Bayes dà ora
100
4 100 1
4
· 0.011
5 60
2
0.0086
P(E)P(B | E)
=
= 5
=
= 0.58
P(E | B) =
P (B)
0.015
0.015
0.015
Poiche P(N | B) = 1 − P(E | B) = 0.42 è ancora più probabile che sia una moneta equilibrata.
Esercizio 3. a) Il coefficiente di correlazione e il quoziente tra la covarianza ed il prodotto
delle deviazioni standard, che sono le radici quadrate delle varianze. Calcoliamo queste
quantità. Intanto troviamo le medie
1
(0 + 1 + 3 + 4) = 2
4
1
1
ȳ = (3 + 0.2.3) = −
4
2
e poi le varianze e la covarianza
x̄ =
5
1 2
26
(0 + 12 + 22 + 32 ) − x̄ 2 =
−4=
4
4
2
1
22
1
21
σY2 = (32 + 02 + (−2)2 + (−3)2 ) − ȳ 2 =
− =
4
4
4
4
18
7
1
σX,Y = (0 · 3 + 1 · 0 − 3 · 2 − 4 · 3) − x̄ ȳ = − + 1 = −
4
4
2
Dunque il coefficiente di correlazione tra le due variabili è
σX2 =
ρX,Y =
−7
σX,Y
= q q2 = −0.97
σX σY
5 21
2
4
b) La retta di regressione di Y su X è la retta di equazione y = ax + b dove
− 27
σX,Y
7
a = 2 = 5 = − = −1.4
5
σX
2
7 23
1
b =ȳ − a x̄ = − − 2 −
= 2.3
=
2
5
10
Dunque l’equazione della retta di regressione è
23
7
y=− x+
5
10
c) Le due variabili appaiono essere dipendenti in maniera antitetica: Y tende a decrescere al crescere di X. Il valore del coefficiente di correlazione molto vicino a −1 fa
pensare a una dipendenza molto forte.
Esercizio 4. a) Ci si può ricondurre a una distribuzione multinomiale: scelta di 4 individui
con probabilità q1 = 0.49 per ognuno di essi di essere di tipo 0, q2 = 0.38 di essere di
tipo A, q3 = 0.1 + 0.03 = 0.13 di essere di tipo B oppure AB. L’espressione della legge
multinomiale dà allora la probabilità
4!
q1 q2 q32 = 0.0362 = 3.62%
1!1!2!
b) Ripetendo il ragionamento precedente troviamo
4!
q12 q22 = 0.191 = 19.1%
2!2!0!
c) Per ognuno dei 4 individui la probabilità di essere di tipo B oppure AB è pari a
p = 0.13. Il numero d’individui di uno di questi due tipi nel campione di 4 segue una legge
binomiale B(4, p). La probabilità per una tale distribuzione di avere 0 è quindi
4
(1 − p)4 = 0.874 = 0.573 = 57.3%
0
Da notare che in questa parte dell’esercizio non c’è bisogno di ricorrere alla legge multinomiale (la binomiale è sufficiente).