Elementi di Analisi Numerica, Probabilità e Statistica, modulo 2

Elementi di Analisi Numerica, Probabilità e Statistica,
modulo 2: Elementi di Probabilità e Statistica (3 cfu)
Probabilità e Statistica (6 cfu)
Scritto del 06 febbraio 2015. Secondo Appello Id: A
Esame da 3
Nome e Cognome:
6 cfu (barrare la casella interessata)
Si ricorda che nella correzione dell'elaborato si valuteranno anche i procedimenti che portano ai risultati nali. Tali
procedimenti devono essere descritti o giusticati in modo sintetico, ma chiaro. Riportare solo il risultato nale,
anche se corretto, verrà considerato errore. Inne per ottenere la sufficienza è necessario svolgere, almeno
in parte, tutti gli esercizi richiesti.
Problema 1 (tutti)
Dieci persone arrivano ad un ristorante con tre sale e ciascuna sceglie a caso la sala. Trovare la probabilità che
1. 3/30
ci siano tre persone nella prima sala;
2. 3/30
ci siano due sale con una persona ciascuna;
3. 4/30
ci siano almeno tre persone in ciascuna sala;
Problema 2 (tutti)
Due v.a. X e Y sono indipendenti e distribuite in maniera esponenziale di parametro λ. Si consideri la v.a.
Z=
1. 2/30
X −Y
.
X +Y
Determinare i valori assunti da Z .
2. 4/30 Calcolare P (Z < z) e dimostrare che Z è distribuita in maniera uniforme nell'intervallo trovato al
punto precedente.
3. 4/30
Calcolare il valore di a > 1 tale che P (X < aY |Z > 0) = 1/a.
Problema 3 (solo esame 6 cfu)
Nel Mondiale di calcio FIFA 2006 sono state disputate 64 partite in totale. Il numero di goal per partita è
riportato di seguito:
8 partite con 0 goal
13 partite con 1 goal
18 partite con 2 goal
11 partite con 3 goal
10 partite con 4 goal
2 partite con 5 goal
2 partite con 6 goal
Si vuol testare l'ipotesi che la v.a. X = numero di goal per partita sia distribuita come una poissoniana di
parametro µ. Essendo µ incognito si decide di usare il metodo di massima verosimiglianza per determinarlo dal
campione X1 , . . . , X64 riportato sopra.
1. 3/30 Determinare, usando il principio di massima verosimiglianza, lo stimatore U di µ per un campione
poissoniano e dimostrare che è corretto;
2. 3/30
Utilizzando il teorema di Cramer-Rao dimostrare che U ha varianza minima;
3. 4/30 Eettuare l'opportuno test del χ2 e discutere se al livello di signicatività del 5% si può rigettare
l'ipotesi.
Soluzione
Problema 1 (tutti)
1. Si tratta di uno schema multinomiale. Dette Xi le v.a. numero di persone nella sala i-esima si ha
P (X1 = n1 , X2 = n2 , X3 = n3 ) =
N!
pn1 pn2 pn3 ,
n1 !n2 !n3 ! 1 2 3
con p1 + p2 + p3 = 1 e n1 + n2 + n3 = N . Nel caso in questione pi = 1/3 in quanto le sale sono scelte a caso e
N = 10.
La probabilità richiesta è pertanto
P (X1 = 3) =
X
P (X1 = 3, X2 = n2 , X3 = n3 )
n2 ,n3 ≥0
n2 +n3 +3=N
=
10! 3
p1
3!7!
X
n2 ,n3 ≥0
7!
pn2 pn3
n2 !n3 ! 2 3
n2 +n3 =7
„ «
10 3
p1 (p2 + p3 )7
=
3
„ «
10 3
=
p1 (1 − p1 )7
3
che rappresenta una binomiale e alla quale ci si poteva ricondurre da subito denendo il successo = sceglie
la sala 1. Continuando ed usando l'ipotesi di equiprobabilità della scelta della sala
„ «
10 3
p1 (1 − p1 )7
3
„ «
10
=
(1/3)3 (2/3)7
3
„ «
10 7
2
3
=
310
P (X1 = 3) =
che ha un'interpretazione alla Laplace evidente. I casi possibili sono 310 in quanto ogni persona ha 3„possibili
«
10
scelte indipendentemente da quello che hanno fatto le altre. Per i casi favorevoli basta osservare che
è il
3
numero di modi (combinazioni) con cui si possono scegliere 3 persone da un gruppo di 10 e quindi rappresenta
in quanti modi si possono mettere 3 persone nella prima sala. Per ognuno di questi modi bisogna calcolare
in quanti modi si sistemano le rimanenti 7 persone: ognuna ha 2 possibilità e quindi 27 modi. Ovviamente si
poteva usare da subito l'impostazione alla Laplace semplicando i conti.
2. Conviene usare lo schema di Laplace.
„ «„
«„
«
10
10 − 1
10 − 1 − 1
1
1
10 − 1 − 1
P (X1 = 1, X2 = 1) =
310
„ «„ «
10
9
1
1
=
310
L'interpretazione è come alla risposta precedente: 310 sono i casi possibili, mentre i coecienti binomiali
esprimono in quanti modi si possono sistemare rispettivamente la prima la seconda e la terza sala.
La prob. richiesta non tiene conto di quali sale devono contenere
„ « 1 persona per cui bisogna considerare in
3
= 3 e quindi la prob. richiesta è
2
„ «„ «
10
9
1
1
P (2 sale con una persona) = 3
10
3
quanti modi si possono scegliere 2 sale da un gruppo di 3, cioè
Oppure più formalmente
P (2 sale con una persona) = P ({X1 = 1, X2 = 1} ∪ {X1 = 1, X3 = 1} ∪ {X2 = 1, X3 = 1})
= P ({X1 = 1, X2 = 1}) + P ({X1 = 1, X3 = 1}) + P ({X2 = 1, X3 = 1})
= 3P ({X1 = 1, X2 = 1})
3. Ripetendo il ragionamento del punto precedente si ha
„ «„ «„ «
4
7
10
4
3
3
P (almeno 3 persone in ciascuna sala) = 3
10
3
Problema 2 (tutti)
1. Bisogna studiare i valori assunti da Z al variare di X e Y (X, Y ≥ 0). Ci sono molti modi di farlo. Quello più
semplice consiste nel notare che se Z assume il valore zo in corrispondenza di (x0 , y0 ) allora assume anche −z0
in corrispondenza di (y0 , x0 ). Quindi Z assume valori in un intervallo simmetrico intorno a 0. Determiniamolo
|Z| =
|X − Y |
|X − Y |
|X| + | − Y |
=
≤
=1
|X + Y |
X +Y
X +Y
Quindi −1 ≤ Z ≤ 1.
2. Dalla denizione
„
FZ (z) ≡ P (Z < z) = P
=P
X −Y
<z
X +Y
«
„
1−z
X
Y >
1+z
Z
+∞
=
d x λ e−λx
= ···
«
+∞
Z
λ e−λy d y
1−z
x
1+z
0
= ···
z+1
=
.
2
Abbiamo cosi dimostrato che pZ (z) = FZ0 (z) = 1/2 che è la densità uniforme in [−1, 1].
3. Dalla denizione
P (X < aY, Z > 0)
P (Z > 0)
P (X < aY, X − Y > 0)
=
1/2
P (X < aY |Z > 0) ≡
= 2P (Y > X/a, Y < X)
Z +∞
Z x
−λx
=2
d xλ e
λ e−λy d y
0
x/a
= ···
a−1
.
=
a+1
Il valore di a richiesto si ottiene risolvendo
√
a−1
1
= ⇒a=1+ 2
a+1
a
Problema 3 (solo esame 6 cfu)
1. Si ha P (X = xi ) = e−µ µxi /xi ! con xi = 0, 1, 2, . . . e quindi, per un campione X1 , . . . , XN la verosimiglianza è
L=
N
Y
e−µ µxi /xi ! = e−N µ µ
P
i
xi
i=1
da cui
ln L = −N µ +
X
xi ln µ −
X
i
e quindi
X 1
∂L
= 0 = −N +
xi ,
∂µ
µ
i
Y 1
xi !
ln xi !
che risolta per µ da lo stimatore di massima verosimiglianza
U≡
1 X
Xi
N i
che coincide con la media campionaria. È corretto infatti
1 X
E[Xi ] = E[X] = µ
N i
E[U ] =
e la varianza è
Var[U ] =
1 X
Var[Xi ] = Var[X]/N = µ/N
N2 i
2. Per utilizzare il teorema di Cramer-Rao bisogna calcolare
!2 #
∂ ln P (X = n)
.
∂µ
"
E
Risulta
∂ ln P (X = n)
n
= −1 +
∂µ
µ
e quindi
"
E
!2 #
∂ ln P (X = n)
= E[(−1 + X/µ)2 ] = . . . = 1/µ.
∂µ
Applicando Cramer-Rao si ha
Var[U ] ≥
1
·
N
1
"
E
µ
!2 # =
N
∂ ln P (X = n)
∂µ
da cui segue la tesi.
3. Per applicare il test del χ2 si deve costruire la statistica
V =
k
X
(Ni − N πi )2
N πi
i=1
dove Ni è il numero osservato di volte che si è vericato l'evento i-esimo, πi è la probabilità attesa per lo stesso
evento e N è il numero totale di osservazioni. Inoltre per applicare il test bisogna che sia N πi & 5. Si ricorda
che V ∼ χ2k−1−m dove m è il numero di parametri che si calcolano dai dati. Gli Ni si leggono praticamente
dal testo dell'esercizio, mentre per calcolare i πi occorre utilizzare la statistica studiata nelle due domande
precedenti
U=
64
1 X
144
1
(0 · N0 + 1 · N1 + 2 · N2 . . .) = . . . =
= 2.25
Xi =
64 i=1
64
64
che rappresenta il valore stimato dal campione del parametro µ. Quindi si possono calcolare i πi = e−µ µi /i!
π0
= 0.1054
N π0 = 6.7
π1
= 0.2371
N π1 = 15.2
π2
= 0.2668
N π2 = 17.1
π3
= 0.2001
N π3 = 12.8
π4
= 0.1126
N π4 = 7.2
π5
= 0.0506
N π5 = 3.2
π6
= 0.0189
N π6 = 1.2
Si vede che per rispettare la condizione N πi & 5 bisogna raggruppare le ultime due classi in una unica
π0
= 0.1054
N π0 = 6.7
π1
= 0.2371
N π1 = 15.2
π2
= 0.2668
N π2 = 17.1
π3
= 0.2001
N π3 = 12.8
π4
= 0.1126
N π4 = 7.2
π≥5
= 0.078
N π≥5 = 4.99
.
Adesso si può valutare la statistica χ2
V =
=
6
X
(Ni − N πi )2
N πi
i=1
(13 − 15.2)2
(18 − 17.1)2
(11 − 12.8)2
(10 − 7.2)2
(4 − 4.99)2
(8 − 6.7)2
+
+
+
+
+
≈ 2.1 ≡ v0
6.7
15.2
17.1
12.8
7.2
4.99
Si ha V ∼ χ26−1−1 , pertanto il p-dei-dati vale.
P (χ24 ≥ 2.1) ' 0.7
ovvero l'ipotesi nulla si accetta no al livello di signicatività del 70% circa.
Volendo invece trovare le zone di rigetto P (χ24 ≥ vα ) = α si ha v5% ' 9.5 e v1% ' 13.2 e quindi essendo v0 < vα
l'ipotesi si accetta sia al 5% che all'1%.