Esercizio 1 Esercizio 2 - Dipartimento di Economia, Finanza e

SIGI, Statistica II, esercitazione n. 3
1
U NIVERSITÀ DEGLI S TUDI DI P ERUGIA
FACOLTÀ DI E CONOMIA – C ORSO DI L AUREA S.I.G.I.
S TATISTICA II
Esercitazione n. 3
Esercizio 1
Una v.c. X si dice v.c. esponenziale con parametro λ se possiede funzione di densità
f (x) = λ e−λx
,0 ≤ x < ∞
Dato un campione casuale di n osservazioni:
• determinare la funzione di verosimiglianza;
• derivare lo stimatore di massima verosimiglianza di λ;
[Suggerimento: La procedura risulta spesso semplificata se si massimizza la log-verosimiglianza]
• sulla base dello stimatore ottenuto per λ, definire lo stimatore di massima verosimiglianza
per la media di X.
[Suggerimento: Si ricordi la relazione tra la v.c. esponenziale e la v.c. gamma, da cui
è immediato ottenere il valore atteso di X. Quindi, utilizzare la proprietà 1 (pag. 242)
degli stimatori di massima verosimiglianza]
• dati i seguenti valori:
0,2978 0,2536 0,6291 0,5297 0,5692
determinare la funzione di verosimiglianza come funzione del parametro sconosciuto e
fornire la stima di massima verosimiglianza.
• considerando i dati del punto precedente, disegnare la funzione di verosimiglianza per i
valori di λ pari a 1, 2, 3, 4, 5, 6.
Esercizio 2
Si supponga che per un campione di n = 16 pezzi di metallo, la perdita di peso (in gr) dopo un
certo intervallo di tempo sia stata la seguente:
2,66 2,03 3,67 3,60 2,41 3,25 3,32 3,11 3,36 3,11 4,27 3,95 4,28
3,82 4,50 3,38
Assumendo una distribuzione normale
SIGI, Statistica II, esercitazione n. 3
2
• si costruisca un intervallo di confidenza al 99% per la media della perdita di peso dei
pezzi di metallo.
• si determini l’ampiezza dell’intervallo e si studi come varia tale ampiezza al variare della
varianza campionaria mantenendo costante la dimensione campionaria.
Esercizio 3
La varianza campionaria del tempo di funzionamento di un campione di 30 frigoriferi è risultata
pari a 9‚1.
• Determinare i limiti di un intervallo fiduciario al 95% per la varianza del tempo di funzionamento di tutti i frigoriferi.
• Se lo stesso intervallo fosse richiesto per la deviazione standard, quali sarebbero i limiti?
[Suggerimento: Ci si avvalga della relazione funzionale esistente tra varianza e deviazione standard]
• Quale assunzione si è indirettamente adottata nel calcolare i limiti di confidenza dei punti
precedenti?
Esercizio 4
In uno studio medico sulle problematiche alle coronarie è stato selezionato un campione di n =
88 pazienti, rappresentativi di un gruppo di individui che presentano approssimativamente gli
stessi fattori di rischio (classe di età, fumo, colesterolo, ecc.). Dei soggetti estratti 15 riportano
di soffrire di problemi alle coronarie.
• per gli individui che appartengono alla classe di rischio individuata, qual è la probabilità
di soffrire di problemi alle coronarie ?
• calcolare un intervallo di confidenza al 90% per la suddetta probabilità.
[Suggerimento: Per tale calcolo si assuma il caso dei grandi campioni]
SIGI, Statistica II, esercitazione n. 3
3
Soluzioni
Esercizio 1
Sia X ∼ Esponenziale(λ), per cui la funzione di verosimiglianza per un campione casuale di n
osservazioni è data da
L(λ) =
n
Y
f (xi ) = λn e−λ
Pn
i=1
xi
i=1
mentre la log-verosimiglianza è
l(λ) = log L(λ) = n log(λ) − λ
n
X
xi
i=1
Lo stimatore di massima verosimiglianza sarà quel valore λ che massimizza l(λ), o equivalentemente L(λ). Quindi
n
n X
∂l(λ)
= −
xi = 0
∂λ
λ
1
⇒
n
λ̂ = Pn
i=1
xi
=
1
x
∂ 2 l(λ)
n
=− 2 <0
2
∂λ
λ
il che garantisce che il valore trovato sia un massimo.
La v.c. esponenziale è un caso specifico della v.c. gamma, con parametro α = 1 (usando
la notazione di pag. 87–89 del libro). Ricordando che il valore atteso di una v.c. gamma è
E(X) = α/λ, si ottiene
1
λ
Utilizzando la proprietà di invarianza delle stime di massima verosimiglianza, possiamo scrivere
P
1
xi
Ê(X) = = i=1 = x
n
λ̂
E(X) =
ovvero lo stimatore di massima verosimiglianza per la media di una v.c. esponenziale è la media
campionaria.
Per il campione dato di n = 5 osservazioni, si ha
verosimiglianza
P
xi = 2‚2794, da cui la funzione di
L(λ) = λ5 e−2‚2794λ
la quale è massimizzata da
λ̂ =
1
1
=
= 2‚19356
x
2‚2794/5
La funzione di verosimiglianza per i dati valori di λ è riportata nella figura seguente:
SIGI, Statistica II, esercitazione n. 3
0.20
0.10
L(λ)
0.30
4
λ
L(λ)
1
0.10235
2
0.33519
3
0.2605
4
0.11235
5
0.03509
6
0.00894
0.3422
0.00
MLE 2.19356
0
1
2
3
4
5
6
λ
Esercizio 2
Si tratta di calcolare un intervallo di confidenza per la media di una popolazione di cui non
si conosce la varianza, sulla base di un campione di piccole dimensioni. Quindi, si userà la
statistica
T =
X −µ
√
S/ n
ovvero la v.c. t di Student con n − 1 gradi di libertà. In generale, quindi, un intervallo di
confidenza per µ al livello (1 − α)100% è dato da
√
√ x − tα/2;n−1 s/ n ; x + tα/2;n−1 s/ n
Nel nostro caso n = 16, x = 3‚42, s =
√
0‚4618, α = 0.01, t0‚01/2;15 = 2‚947, per cui
sostituendo nella formula generale i limiti di un intervallo di confidenza al 99% sono
p
p
3‚42 − 2‚947 0‚4618/16 ; 3‚42 + 2‚947 0‚4618/16
(2‚92 ; 3‚92)
L’ampiezza del precedente intervallo è pari ad 1. Assumendo la medesima dimensione
campionaria, l’ampiezza di tale intervallo aumenta all’aumentare della varianza campionaria, e,
viceversa, diminuisce al diminuire della varianza campionaria.
SIGI, Statistica II, esercitazione n. 3
5
Esercizio 3
Il problema consiste nel determinare un intervallo fiduciario (o di confidenza) per la varianza
di una popolazione che si assume essere distribuita normalmente (e questo risponde all’ultimo
punto).
Sotto l’ipotesi di normalità la v.c. (n − 1)S 2 /σ 2 ∼ χ2n−1 , per cui un intervallo di confidenza
per σ 2 al livello (1 − α)100% è dato da
(n − 1)S 2 /χ2n−1;1−α/2 ; (n − 1)S 2 /χ2n−1;α/2
Essendo n = 30, s2 = 9‚1, α = 0‚05, χ20‚05/2;29 = 16‚05, χ21−0‚05/2;29 = 45‚72, i limiti di un
intervallo di confidenza per σ 2 al livello 95% sono
(29 · 9‚1/45‚72 ; 29 · 9‚1/16‚05)
(5‚77 ; 16‚44)
Lo stesso intervallo per la deviazione standard σ si ottiene come segue
q
q
(n − 1)S 2 /χ2n−1;1−α/2 ; (n − 1)S 2 /χ2n−1;α/2
√
√
5‚77 ; 16‚44
(2‚40 ; 4‚05)
Esercizio 4
La probabilità di soffrire di problemi alle coronarie è data da p̂ = 15/88 = 0‚17.
Assumendo che il campione sia sufficientemente grande da giustificare l’approssimazione
della distribuzione binomiale con una normale, i limiti di un intervallo fiduciario al 90% sono
p
p
p̂ − zα/2 p̂(1 − p̂)/n ; p̂ + zα/2 p̂(1 − p̂)/n
p
p
0‚17 − 1‚645 0‚17(1 − 0‚17)/88 ; 0‚17 + 1‚645 0‚17(1 − 0‚17)/88
(0‚1041 ; 0‚2359)