Soluzione Intervalli di confidenza

annuncio pubblicitario
Intervalli di confidenza
Soluzione Es.1. Questo esercizio è analogo al successivo quindi, per i dettagli, si rimanda
all’esercizio seguente (più completo e riassuntivo) mentre riportiamo qui brevemente solo
i calcoli. Un intervallo di confidenza con livello di confidenza 1 − α per la media in questo
S̄n (n−1)
caso è dato da µ = xn ± √
t
.
n 1− α
2
(a) In corrispondenza dei dati e di α = 0, 05 otteniamo l’intervallo (125,33 , 132,47).
(89)
(b) La lunghezza dell’intervallo è 2 √S̄90
t
= 7.14
90 0.975
(c) Aumentando il livello di confidenza aumenta la lunghezza dell’intervallo in quanto
aumenta la probabilità che il parametro (media) appartenga all’intervallo. Infatti facendo
(89)
i calcoli si ottiene 2 √S̄90
t
= 9.43.
90 0.995
(359)
(d) In questo caso la lunghezza dell’intervallo è 2 √S̄360
t
= 3.51 e quindi diminuisce.
360 0.975
Soluzione Es.2. Calcoliamo la media campionaria x̄n .
n
x̄n =
1X
0, 39 + 0, 68 + · · · + 3, 69
xi =
= 1, 685
n i=1
12
e per l’intervallo di confidenza utilizziamo la formula (valida quando sigma2 è nota)
σ
µ ∈ x̄n ± √ z1− α2
n
quindi (a)
r
0, 085
z1− α2
12
Se vogliamo l’intervallo di livello 95% poniamo α = 0, 05 e quindi calcoliamo z1−0,025 =
z0,975 = 1, 96 mentre per il livello 99% sarà α = 0, 01 e quindi calcoliamo z1−0,005 = z0,995 =
2, 57. Infine otteniamo i due intevalli sostituendo i valori di z1− α2
µ ∈ 1, 685 ±
µ ∈ (1, 16 , 2, 21) di livello 95%
µ ∈ (1, 00 , 2, 37) di livello 99%
e come si vede l’intervallo di livello di confidenza più alto è più esteso.
(b) Supponiamo ora che la varianza non sia nota e stimiamola quindi attraverso il campione
usilizzando la statistica s̄2n
n
s̄2n
1 X
=
(xi − x̄n )2 = 0, 85
n − 1 i=1
c
2001
S.M.Iacus - D.E.P.A. Sezione di Statistica e Matematica
1
Essendo la varianza incognita si deve ricorrere all’uso della statistica T di student con
n − 1 gradi di libertà, cioè l’intevallo di confidenza si ottiene attraverso la formula
r
s̄2n (n−1)
t α
µ ∈ x̄n ±
n 1− 2
Nei due casi i valori della T di student sono
(11)
(11)
t1− 0,05 = t0,975 = 2, 201
2
e
(11)
(11)
t1− 0,01 = t0,995 = 3, 106
2
Infine, sostituendo i valori si ottiene
µ ∈ (1, 10 , 2, 27) di livello 95%
µ ∈ (0, 86 , 2, 51) di livello 99%
che come si vede sono più ampi dei corrispondenti intervalli calcolati in precedenza.
Soluzione Es.3. Siamo in uno schema di Bernoulli se ipotizziamo che gli elettori si
eprimano in modo indipedente gli uni dagli altri e se pensiamo alla popolazione di tutti
gli elettori come ad una popolazione molto ampia in modo tale che la probabilità di
estrarre un elettore di un tipo (SI) piuttosto che un altro (NO) non vari da un’estrazione
alla successiva. Quindi ogni elettore è una variabile casuale di Bernoulli di parametro p
= “proporzione di SI nella popolazione”. Sappiamo che
p̂ − p
qn
p̂n (1−p̂n )
n
p̂n − p
=⇒ q
∼Z
n grande
p(1−p)
n
P
dove p̂n = n1 ni=1 Xi = X̄n è la proporzione dei SI nel campione. Quindi l’intervallo di
confidenza assume la forma
r
p̂n (1 − p̂n )
z1− α2
p ∈ p̂n ±
n
dove per α = 0, 05 → z0,975 = 1, 96 e α = 0, 01 → z0,995 = 2, 57 quindi
p ∈ (0, 49 , 0, 53) di livello 95%
µ ∈ (0, 48 , 0, 54) di livello 99%
c
2001
S.M.Iacus - D.E.P.A. Sezione di Statistica e Matematica
2
Per rispondere al quesito b usiamo direttamente la variabile casuale Bionamiale Y =
n
P
Xi . Quindi i SI vincono se raggiungono almeno la metà più uno de voti, cioè da n2 in
i=1
poi. Prima di continuare con i calcoli ricordiamo che
Y − n p̂n
p
n p̂n (1 − p̂n )
Y − np
=⇒ p
n p (1 − p)
∼Z
n grande
Dobbiamo calcolare
n
P Y >
'P
2
Z>p
n
2
− n p̂n
!
n p̂n (1 − p̂n )
√ (0, 5 − 0, 51)
1−Φ
n √
0, 51 0, 49
√ 1 − Φ −0, 2 n
√
= Φ(0, 2 n)


n = 2500
Φ(1) = 0, 84
= Φ(0, 63) = 0, 74 n = 1000


Φ(0, 45) = 0, 67 n = 500
Per l’ultimo punto c dobbiamo pensare ad un test di ipotesi sulle proporzioni dove p̂n =
0, 505 e l’ipotesi nulla H0 : p = p0 = 0, 5 contro l’alternativa H1 : p > p0 oppure, più
semplicemente, ricorrere alla formula che abbiamo derivato poco sopra ponendola pari a
0,99 % :
√ (0, 5 − 0, 505)
n
=P Z> n√
P Y >
= 0, 99
2
0, 505 0, 495
cioè si deve risolvere rispetto ad n l’equazione
z0,01 =
√ (0, 5 − 0, 505)
n√
0, 505 0, 495
dunque
−2, 33 '
√
√ −0, 005
n
0, 5
n ' 233
e infine
n = 2332 = 54289
Quindi occorre avere un campione enormemente più grande di quelli ipotizzati.
c
2001
S.M.Iacus - D.E.P.A. Sezione di Statistica e Matematica
3
Soluzione Es.4. Questo esercizio ricalca il precedente. L’unica variante è il livello di
confidenza dell’intervallo. L’intervallo di confidenza avrà quindi la seguente struttura
s̄
√n
µ ∈ x̄n ± tn−1
1− α
2
n
Poiché n è molto grande, si ricorre all’approssimazione della t di Student con la Gaussiana,
quindi l’intervalo sarà della forma
s̄n
µ ∈ x̄n ± z1− α2 √
n
e quindi
µ ∈ 1, 55 ± 1, 15
0, 5
10
cioè
µ ∈ (1, 49 , 1, 61) di livello 75%
Soluzione Es.5. Anche in questo caso è un intervallo di confidenza sulle proporzioni,
quindi si applica la formula
r
p̂n (1 − p̂n )
p ∈ p̂n ±
z1− α2
n
dove, in questo caso, p̂n =
284
.
1000
Quindi
p ∈ (0, 26 , 0, 31) di livello 95%
c
2001
S.M.Iacus - D.E.P.A. Sezione di Statistica e Matematica
4
Scarica