Elementi di Analisi Numerica, Probabilità e Statistica, modulo 2: Elementi di Probabilità e Statistica (3 cfu) Probabilità e Statistica (6 cfu) Scritto del 06 febbraio 2015. Secondo Appello Id: A Esame da 3 Nome e Cognome: 6 cfu (barrare la casella interessata) Si ricorda che nella correzione dell'elaborato si valuteranno anche i procedimenti che portano ai risultati nali. Tali procedimenti devono essere descritti o giusticati in modo sintetico, ma chiaro. Riportare solo il risultato nale, anche se corretto, verrà considerato errore. Inne per ottenere la sufficienza è necessario svolgere, almeno in parte, tutti gli esercizi richiesti. Problema 1 (tutti) Dieci persone arrivano ad un ristorante con tre sale e ciascuna sceglie a caso la sala. Trovare la probabilità che 1. 3/30 ci siano tre persone nella prima sala; 2. 3/30 ci siano due sale con una persona ciascuna; 3. 4/30 ci siano almeno tre persone in ciascuna sala; Problema 2 (tutti) Due v.a. X e Y sono indipendenti e distribuite in maniera esponenziale di parametro λ. Si consideri la v.a. Z= 1. 2/30 X −Y . X +Y Determinare i valori assunti da Z . 2. 4/30 Calcolare P (Z < z) e dimostrare che Z è distribuita in maniera uniforme nell'intervallo trovato al punto precedente. 3. 4/30 Calcolare il valore di a > 1 tale che P (X < aY |Z > 0) = 1/a. Problema 3 (solo esame 6 cfu) Nel Mondiale di calcio FIFA 2006 sono state disputate 64 partite in totale. Il numero di goal per partita è riportato di seguito: 8 partite con 0 goal 13 partite con 1 goal 18 partite con 2 goal 11 partite con 3 goal 10 partite con 4 goal 2 partite con 5 goal 2 partite con 6 goal Si vuol testare l'ipotesi che la v.a. X = numero di goal per partita sia distribuita come una poissoniana di parametro µ. Essendo µ incognito si decide di usare il metodo di massima verosimiglianza per determinarlo dal campione X1 , . . . , X64 riportato sopra. 1. 3/30 Determinare, usando il principio di massima verosimiglianza, lo stimatore U di µ per un campione poissoniano e dimostrare che è corretto; 2. 3/30 Utilizzando il teorema di Cramer-Rao dimostrare che U ha varianza minima; 3. 4/30 Eettuare l'opportuno test del χ2 e discutere se al livello di signicatività del 5% si può rigettare l'ipotesi. Soluzione Problema 1 (tutti) 1. Si tratta di uno schema multinomiale. Dette Xi le v.a. numero di persone nella sala i-esima si ha P (X1 = n1 , X2 = n2 , X3 = n3 ) = N! pn1 pn2 pn3 , n1 !n2 !n3 ! 1 2 3 con p1 + p2 + p3 = 1 e n1 + n2 + n3 = N . Nel caso in questione pi = 1/3 in quanto le sale sono scelte a caso e N = 10. La probabilità richiesta è pertanto P (X1 = 3) = X P (X1 = 3, X2 = n2 , X3 = n3 ) n2 ,n3 ≥0 n2 +n3 +3=N = 10! 3 p1 3!7! X n2 ,n3 ≥0 7! pn2 pn3 n2 !n3 ! 2 3 n2 +n3 =7 „ « 10 3 p1 (p2 + p3 )7 = 3 „ « 10 3 = p1 (1 − p1 )7 3 che rappresenta una binomiale e alla quale ci si poteva ricondurre da subito denendo il successo = sceglie la sala 1. Continuando ed usando l'ipotesi di equiprobabilità della scelta della sala „ « 10 3 p1 (1 − p1 )7 3 „ « 10 = (1/3)3 (2/3)7 3 „ « 10 7 2 3 = 310 P (X1 = 3) = che ha un'interpretazione alla Laplace evidente. I casi possibili sono 310 in quanto ogni persona ha 3„possibili « 10 scelte indipendentemente da quello che hanno fatto le altre. Per i casi favorevoli basta osservare che è il 3 numero di modi (combinazioni) con cui si possono scegliere 3 persone da un gruppo di 10 e quindi rappresenta in quanti modi si possono mettere 3 persone nella prima sala. Per ognuno di questi modi bisogna calcolare in quanti modi si sistemano le rimanenti 7 persone: ognuna ha 2 possibilità e quindi 27 modi. Ovviamente si poteva usare da subito l'impostazione alla Laplace semplicando i conti. 2. Conviene usare lo schema di Laplace. „ «„ «„ « 10 10 − 1 10 − 1 − 1 1 1 10 − 1 − 1 P (X1 = 1, X2 = 1) = 310 „ «„ « 10 9 1 1 = 310 L'interpretazione è come alla risposta precedente: 310 sono i casi possibili, mentre i coecienti binomiali esprimono in quanti modi si possono sistemare rispettivamente la prima la seconda e la terza sala. La prob. richiesta non tiene conto di quali sale devono contenere „ « 1 persona per cui bisogna considerare in 3 = 3 e quindi la prob. richiesta è 2 „ «„ « 10 9 1 1 P (2 sale con una persona) = 3 10 3 quanti modi si possono scegliere 2 sale da un gruppo di 3, cioè Oppure più formalmente P (2 sale con una persona) = P ({X1 = 1, X2 = 1} ∪ {X1 = 1, X3 = 1} ∪ {X2 = 1, X3 = 1}) = P ({X1 = 1, X2 = 1}) + P ({X1 = 1, X3 = 1}) + P ({X2 = 1, X3 = 1}) = 3P ({X1 = 1, X2 = 1}) 3. Ripetendo il ragionamento del punto precedente si ha „ «„ «„ « 4 7 10 4 3 3 P (almeno 3 persone in ciascuna sala) = 3 10 3 Problema 2 (tutti) 1. Bisogna studiare i valori assunti da Z al variare di X e Y (X, Y ≥ 0). Ci sono molti modi di farlo. Quello più semplice consiste nel notare che se Z assume il valore zo in corrispondenza di (x0 , y0 ) allora assume anche −z0 in corrispondenza di (y0 , x0 ). Quindi Z assume valori in un intervallo simmetrico intorno a 0. Determiniamolo |Z| = |X − Y | |X − Y | |X| + | − Y | = ≤ =1 |X + Y | X +Y X +Y Quindi −1 ≤ Z ≤ 1. 2. Dalla denizione „ FZ (z) ≡ P (Z < z) = P =P X −Y <z X +Y « „ 1−z X Y > 1+z Z +∞ = d x λ e−λx = ··· « +∞ Z λ e−λy d y 1−z x 1+z 0 = ··· z+1 = . 2 Abbiamo cosi dimostrato che pZ (z) = FZ0 (z) = 1/2 che è la densità uniforme in [−1, 1]. 3. Dalla denizione P (X < aY, Z > 0) P (Z > 0) P (X < aY, X − Y > 0) = 1/2 P (X < aY |Z > 0) ≡ = 2P (Y > X/a, Y < X) Z +∞ Z x −λx =2 d xλ e λ e−λy d y 0 x/a = ··· a−1 . = a+1 Il valore di a richiesto si ottiene risolvendo √ a−1 1 = ⇒a=1+ 2 a+1 a Problema 3 (solo esame 6 cfu) 1. Si ha P (X = xi ) = e−µ µxi /xi ! con xi = 0, 1, 2, . . . e quindi, per un campione X1 , . . . , XN la verosimiglianza è L= N Y e−µ µxi /xi ! = e−N µ µ P i xi i=1 da cui ln L = −N µ + X xi ln µ − X i e quindi X 1 ∂L = 0 = −N + xi , ∂µ µ i Y 1 xi ! ln xi ! che risolta per µ da lo stimatore di massima verosimiglianza U≡ 1 X Xi N i che coincide con la media campionaria. È corretto infatti 1 X E[Xi ] = E[X] = µ N i E[U ] = e la varianza è Var[U ] = 1 X Var[Xi ] = Var[X]/N = µ/N N2 i 2. Per utilizzare il teorema di Cramer-Rao bisogna calcolare !2 # ∂ ln P (X = n) . ∂µ " E Risulta ∂ ln P (X = n) n = −1 + ∂µ µ e quindi " E !2 # ∂ ln P (X = n) = E[(−1 + X/µ)2 ] = . . . = 1/µ. ∂µ Applicando Cramer-Rao si ha Var[U ] ≥ 1 · N 1 " E µ !2 # = N ∂ ln P (X = n) ∂µ da cui segue la tesi. 3. Per applicare il test del χ2 si deve costruire la statistica V = k X (Ni − N πi )2 N πi i=1 dove Ni è il numero osservato di volte che si è vericato l'evento i-esimo, πi è la probabilità attesa per lo stesso evento e N è il numero totale di osservazioni. Inoltre per applicare il test bisogna che sia N πi & 5. Si ricorda che V ∼ χ2k−1−m dove m è il numero di parametri che si calcolano dai dati. Gli Ni si leggono praticamente dal testo dell'esercizio, mentre per calcolare i πi occorre utilizzare la statistica studiata nelle due domande precedenti U= 64 1 X 144 1 (0 · N0 + 1 · N1 + 2 · N2 . . .) = . . . = = 2.25 Xi = 64 i=1 64 64 che rappresenta il valore stimato dal campione del parametro µ. Quindi si possono calcolare i πi = e−µ µi /i! π0 = 0.1054 N π0 = 6.7 π1 = 0.2371 N π1 = 15.2 π2 = 0.2668 N π2 = 17.1 π3 = 0.2001 N π3 = 12.8 π4 = 0.1126 N π4 = 7.2 π5 = 0.0506 N π5 = 3.2 π6 = 0.0189 N π6 = 1.2 Si vede che per rispettare la condizione N πi & 5 bisogna raggruppare le ultime due classi in una unica π0 = 0.1054 N π0 = 6.7 π1 = 0.2371 N π1 = 15.2 π2 = 0.2668 N π2 = 17.1 π3 = 0.2001 N π3 = 12.8 π4 = 0.1126 N π4 = 7.2 π≥5 = 0.078 N π≥5 = 4.99 . Adesso si può valutare la statistica χ2 V = = 6 X (Ni − N πi )2 N πi i=1 (13 − 15.2)2 (18 − 17.1)2 (11 − 12.8)2 (10 − 7.2)2 (4 − 4.99)2 (8 − 6.7)2 + + + + + ≈ 2.1 ≡ v0 6.7 15.2 17.1 12.8 7.2 4.99 Si ha V ∼ χ26−1−1 , pertanto il p-dei-dati vale. P (χ24 ≥ 2.1) ' 0.7 ovvero l'ipotesi nulla si accetta no al livello di signicatività del 70% circa. Volendo invece trovare le zone di rigetto P (χ24 ≥ vα ) = α si ha v5% ' 9.5 e v1% ' 13.2 e quindi essendo v0 < vα l'ipotesi si accetta sia al 5% che all'1%.