UNIVERSITÀ di ROMA TOR VERGATA Corso di Laurea Magistrale in Scienze della Nutrizione Umana Corso di Statistica Medica, anno 2015-16 P.Baldi Lista di esercizi 3, 4 febbraio 2016. Esercizio 1 Una popolazione d’insetti è composta da due gruppi, A e B, simili tra loro. Si sa che le proporzioni delle due sottofamiglie sono A : 30%, B : 70% Inoltre nel gruppo A gl’individui hanno una colorazione rossa con una proporzione del 55%, mentre una colorazione simile è presente nel gruppo B nella proporzione del 20%. a) Un individuo viene scelto a caso nella popolazione. Qual è la probabilità che presenti la colorazione rossa? b) Qual è la probabilità che un individuo che presenta la colorazione rossa appartenga al gruppo A ? È più probabile che appartenga ad A o a B ? Esercizio 2 Una scatola contiene 10 monete; 8 di queste sono equilibrate, mentre le altre 2 danno testa (T ) con probabilità 23 e croce (C) con probabilità 13 . a) Una moneta viene scelta a caso e lanciata n = 10 volte. a1) Qual è la probabilità di ottenere 6 volte testa. a2) Qual è la probabilità che la moneta sia una di quelle equilibrate sapendo che in 10 lanci si è ottenuto 6 volte testa? È più probabile che sia una moneta truccata oppure equilibrata? b) Rispondere alle stesse domande di a) supponendo che la moneta è stata lanciata 100 volte e che si è ottenuto 60 volte testa. Esercizio 3 Due variabili X e Y sono state misurate su 5 individui ottenendo le misurazioni seguenti: X 0 1 3 4 Y 3 0 -2 -3 a) Qual è il coefficiente di correlazione tra le due variabili ? b) Trovare la retta di regressione di Y su X; c) Le due variabili appaiono dipendere una dall’altra? Che tipo di dipendenza ? Esercizio 4 Si sa che in una popolazione le proporzioni dei 4 gruppi sanguigni sono 0 47% A B 38% 10% AB 3% (si tratta delle proporzioni dell’Australia). Vengono scelti a caso 4 individui. a) Qual è la probabilità di osservare esattamente un individuo di tipo 0 ed uno di tipo A? b) Qual è la probabilità di osservare due individui di tipo 0 e due di tipo A ? c) Qual è la probabilità che nessuno dei 4 sia di tipo B oppure AB ? Soluzioni Esercizio 1. Indichiamo con R l’evento ‘‘l’insetto scelto a caso presenta la colorazione rossa’’, con A l’evento ‘‘l’insetto scelto a caso appartiene alla popolazione A’’ e con B l’analogo evento per la popolazione B. I dati del problema dicono che P(A) = 0.3, P(B) = 0.7 . Inoltre dire che gl’insetti della popolazione A presentano la colorazione rossa con probabilità 0.55 si esprime dicendo che P(R | A) = 0.55. Analogamente si ha P(R | B) = 0.2. a) La probabilità di R si calcola ora facilmente con la formula delle probabilità totali P(R) = P(A)P(R | A) + P(B)P(R | B) = 0.3 · 0.55 + 0.7 · 0.2 = 0.305. b) Si tratta di calcolare la probabilità condizionale di A dato R, cioè P(A | R). Questo si fa con la formula di Bayes P(A | R) = P(A)P(R | A) 0.3 · 0.55 0.165 = = = 0.541. P(R) 0.305 0.305 Invece P (B | R) = 1 − P (A | R) = 0.459: è più probabile che l’insetto con la colorazione rossa provenga dalla popolazione A. Esercizio 2. La parte iniziale di questo esercizio (la modellizzazione) è del tutto simile a quella dell’esercizio precedente. Occorre introdurre due eventi ‘‘si è scelta una moneta equilibrata’’ (chiamiamolo E) e ‘‘si è scelta una moneta che non è equilibrata’’ (chiamiamolo N ). Indichiamo poi con A l’evento ‘‘in 10 lanci si sono ottenute 6 teste’’. I dati del problema c’informano che P(E) = 4 8 = , 10 5 P(N ) = 2 1 = . 10 5 Se la moneta prescelta è equilibrata, allora la probabilità di ottenere 6 teste in 10 lanci è data dalla legge binomiale B(10, 21 ) (10 prove ripetute indipendenti con probabilità 21 di avere testa in una singola prova). Più precisamente la probabilità di avere 6 teste in 10 lanci per la moneta equilibrata è 10 1 10 10 1 6 1 4 = 1− 6 6 2 2 2 Dunque 10 1 10 P(A | E) = 2 6 Se invece la moneta non è equilibrata, la probabilità di avere 6 teste in 10 lanci sarà data dalla legge binomiale B(10, 23 ) (sempre 10 prove ripetute indipendenti ma ora con probabilità 23 di avere testa in una singola prova). Dunque 10 2 6 1 4 P(A | N ) = 1− 6 3 3 a1) Per la formula delle probabilità totali la probabilità di avere 6 teste in 10 lanci risulta essere P(A) = P(E)P(A | E) + P(N )P(A | N ) = 4 4 10 1 10 1 10 2 6 1 4 1 + = · 0.205 + · 0.227 1− 5 6 2 5 6 3 3 5 5 = 0.21 • Attenzione all’errore possibile: se si sceglie a caso una moneta e la si lancia una volta la probabilità di ottenere testa è 45 21 + 15 23 = 0.53. Potrebbe venire la tentazione di dire che il numero di teste in 10 lanci della moneta sia descritto da una binomiale B(10, 0.53), ovvero che sia 10 P(A) = 0.536 0.474 (sbagliata!) 6 In effetti questa sarebbe la risposta giusta se facessimo i 10 lanci estraendo ad ogni lancio una moneta che poi rimettiamo nell’urna. a2) Dobbiamo calcolare P(E | A). Al solito la formula di Bayes dà P(E | A) = P(E)P(A | E) = P(A) 10 4 10 1 5 6 2 0.21 = 4 5 · 0.205 = 0.78 0.21 Poiché P(N | A) = 1 − P(E | A) = 0.32, è più probabile che sia una moneta equilibrata. b1) Stesso conto che in a1), solo che adesso, se indichiamo con B l’evento ‘‘in 100 lanci la moneta ha dato testa 60 volte’’. Abbiamo 100 1 100 P(B | E) = 2 60 dato che il numero di teste in 100 lanci viene descritto da una legge binomiale B(100, 21 ). Invece si avrà 100 2 60 1 40 P(B | N ) = 60 3 3 perché se la moneta è truccata il numero di teste in 100 lanci seguirà una legge B(100, 23 ). Dunque 4 100 1 100 1 100 2 60 1 40 + P(B) = P(E)P(B | E) + P(N )P(B | N ) = 5 60 2 5 60 3 3 Questo calcolo richiede attenzione anche con una calcolatrice. Il risultato comunque è 4 1 5 · 0.011 + 5 · 0.031 = 0.015. b2) La formula di Bayes dà ora 100 4 100 1 4 · 0.011 5 60 2 0.0086 P(E)P(B | E) = = 5 = = 0.58 P(E | B) = P (B) 0.015 0.015 0.015 Poiche P(N | B) = 1 − P(E | B) = 0.42 è ancora più probabile che sia una moneta equilibrata. Esercizio 3. a) Il coefficiente di correlazione e il quoziente tra la covarianza ed il prodotto delle deviazioni standard, che sono le radici quadrate delle varianze. Calcoliamo queste quantità. Intanto troviamo le medie 1 (0 + 1 + 3 + 4) = 2 4 1 1 ȳ = (3 + 0.2.3) = − 4 2 e poi le varianze e la covarianza x̄ = 5 1 2 26 (0 + 12 + 22 + 32 ) − x̄ 2 = −4= 4 4 2 1 22 1 21 σY2 = (32 + 02 + (−2)2 + (−3)2 ) − ȳ 2 = − = 4 4 4 4 18 7 1 σX,Y = (0 · 3 + 1 · 0 − 3 · 2 − 4 · 3) − x̄ ȳ = − + 1 = − 4 4 2 Dunque il coefficiente di correlazione tra le due variabili è σX2 = ρX,Y = −7 σX,Y = q q2 = −0.97 σX σY 5 21 2 4 b) La retta di regressione di Y su X è la retta di equazione y = ax + b dove − 27 σX,Y 7 a = 2 = 5 = − = −1.4 5 σX 2 7 23 1 b =ȳ − a x̄ = − − 2 − = 2.3 = 2 5 10 Dunque l’equazione della retta di regressione è 23 7 y=− x+ 5 10 c) Le due variabili appaiono essere dipendenti in maniera antitetica: Y tende a decrescere al crescere di X. Il valore del coefficiente di correlazione molto vicino a −1 fa pensare a una dipendenza molto forte. Esercizio 4. a) Ci si può ricondurre a una distribuzione multinomiale: scelta di 4 individui con probabilità q1 = 0.49 per ognuno di essi di essere di tipo 0, q2 = 0.38 di essere di tipo A, q3 = 0.1 + 0.03 = 0.13 di essere di tipo B oppure AB. L’espressione della legge multinomiale dà allora la probabilità 4! q1 q2 q32 = 0.0362 = 3.62% 1!1!2! b) Ripetendo il ragionamento precedente troviamo 4! q12 q22 = 0.191 = 19.1% 2!2!0! c) Per ognuno dei 4 individui la probabilità di essere di tipo B oppure AB è pari a p = 0.13. Il numero d’individui di uno di questi due tipi nel campione di 4 segue una legge binomiale B(4, p). La probabilità per una tale distribuzione di avere 0 è quindi 4 (1 − p)4 = 0.874 = 0.573 = 57.3% 0 Da notare che in questa parte dell’esercizio non c’è bisogno di ricorrere alla legge multinomiale (la binomiale è sufficiente).