Test statistici

annuncio pubblicitario
Capitolo 19
Soluzioni degli esercizi a cura di Elena Siletti
Esercizio 19.1: Soluzione
Utilizzando i dati forniti: x̄ = 30; µ0 = 25; σ 2 = 49; n = 25, si ottiene il seguente
valore empirico:
5
x̄ − µ0
30 − 25
5
z=
= √
= 7 = 5 × = 3.57
σ
√
7
√49
n
5
25
posto che α = 0.05 e α2 = 0.025, si ottiene dalle tavole lo zα/ per cui la P Z ≤ zα/ =
2
2
1 − 0.025 = 0.975, ovvero zα/ = 1.96, quindi, essendo: 3.57 ≥ 1.96 si rifiuta l’ipotesi
2
nulla, ovvero il tempo che intercorre tra l’assunzione del farmaco e il suo effetto non
è di 25 minuti.
Il p − value è: P (Z > 3.57) = 1 − Φ (3.57) ∼
= 0 che essendo inferiore all’ α2 scelto, fa
sı̀ che si rifiuti l’ipotesi nulla anche con questo metodo.
Esercizio 19.2: Soluzione
Utilizzando i dati forniti: x̄ = 2.2; µ0 = 2; σ 2 = 0.1; n = 25, si ottiene il seguente
valore empirico:
z=
x̄ − µ0
√σ
n
=
2.2 − 2
√
√0.1
25
=
0.2
0.32
5
= 0.2 ×
5
= 3.125
0.32
posto che α = 0.10 e α2 = 0.05, si ottiene dalle tavole lo zα/ per cui la P Z ≤ zα/ =
2
2
0.90+0.05 = 0.95, ovvero zα/ = 1.65, quindi, essendo: 3.125 ≥ 1.65 si rifiuta l’ipotesi
2
nulla, ovvero che il guasto non abbia modificato il contenuto medio della produzione.
Se non si ha la certezza che la varianza sia rimasta invariata, si utilizza s2 = 0.2
ottenendo il seguente valore empirico:
t24 =
x̄ − µ0
√σ
n
=
2.2 − 2
√
√0.2
25
=
0.2
0.45
5
= 0.2 ×
5
= 2.22
0.45
c 2015, ISBN 9788838668852
Fulvia Mecatti, Statistica di base. Come, quando, perché, 2e. 1
2
Capitolo 19 - Soluzioni degli esercizi
posto che α = 0.01 e α2 = 0.005, si ottiene dalle tavole della T di Student con 24 gdl:
24
t24
α = t0.005 = 4.6041 che lascia a destra una probabilità pari a 0.005.
2
Essendo −4.6041 < 2.22 < 4.6041, si accetta l’ipotesi nulla, ovvero che il guasto
abbia modificato il contenuto medio della produzione.
Posto α = 0.01 e α2 = 0.005, si ottiene dalle tavole lo zα/ per cui la P Z ≤ zα/ =
2
2
0.99 + 0.005 = 0.995, ovvero zα/ = 2.58, quindi, essendo: 3.125 ≥ 2, 58 comunque,
2
anche con un livello di confidenza maggiore, si rifiuta l’ipotesi nulla, ovvero che il
guasto non abbia modificato il contenuto medio della produzione.
Solo ipotizzando la varianza ignota, si accetterebbe l’ipotesi nulla, mentre anche a
livelli di confidenza elevati si rifiuterebbe l’ipotesi che il guasto non abbia modificato
il contenuto medio della produzione.
Esercizio 19.3: Soluzione
Sostituendo i dati forniti dal testo si ottiene il seguente valore empirico:
x
z = qn
− p0
p0 (1−p0 )
n
0.29 − 0.30
−0.01
= q
=q
= −0.218
0.30·0.70
100
0.21
100
Osservando che il test è unidirezionale, si ricava il valore critico del test: α = 0.05
Si è interessati a conoscere il −zα per cui la P (Z ≤ −zα ) = 0.05, dalle tavole si ottiene
zα = 1.65 per cui la P (Z ≤ zα ) = 0.95, che cambiando segno diventa −zα = −1.65.
Essendo −0.218 ≥ −1.65 si accetta l’ipotesi nulla, ovvero si ritiene che la differenza osservata sia casuale e non tale da indicare una riduzione significativa dei consensi.
Esercizio 19.4: Soluzione
Dai dati si ottiene il seguente valore empirico:
χ2 =
2
X X fij − fˆij
i
j
fˆij
= 657.69
Per un livello di significatività 1 − α = 0.95 e con gdl = (h − 1) (k − 1) = 3 × 3 = 9,
si osserva dalle tavole che il valore critico è χ29;0.05 = 16.91 , quindi, essendo 657.69 >
16.91, si rifiuta l’ipotesi nulla di indipendenza. Questo significa che esiste una relazione significativa tra il reddito mensile delle famiglie e la loro dimensione.
Esercizio 19.5: Soluzione
c 2015, ISBN 9788838668852
Fulvia Mecatti, Statistica di base. Come, quando, perché, 2e. Capitolo 19 - Soluzioni degli esercizi
3
Utilizzando i dati si ottiene il seguente valore empirico:
√
x̄ − µ0
25000 − 26000
50
z=
=
= −1000 ×
= −70.71
100
√σ
√
100
n
50
z0.05 = −1.64, poiché −70.71 < −1.64, si rifiuta l’ipotesi nulla, ovvero, il processo
produttivo deve considerarsi fuori controllo.
Esercizio 19.6: Soluzione
Utilizzando i dati si ottiene: x̄ =
1
n
n
P
xi =
i=1
1483
15
= 98.87; µ0 = 90;
n
5621.78
1 X
2
(xi − x̄) =
= 401.55; n = 15
s =
n − 1 i=1
14
2
ovvero,il valore empirico:
t14 =
x̄ − µ0
√σ
n
=
98.87 − 90
√
401.55
√
15
√
= 8.87 · √
15
= 1.714
401.55
14
Posto che α = 0.01, si ottiene dalle tavole della T di Student con 14 gdl: t14
α = t0.01 =
2.624 essendo 1.714 < 2.624 non si rifiuta l’ipotesi nulla, ovvero non ci sono motivi
per ritenere che il tempo di attesa sia superiore a 90 giorni.
Esercizio 19.7: Soluzione
Considerando p, la proporzione di licenziati di sesso femminile:
p0 = 0.5; p0 (1 − p0 ) = 0.25; n = 28;p̂ = nx = 23
28 = 0.82;
Sostituendo i dati si ottiene il seguente valore osservato:
x
z = qn
− p0
p0 (1−p0 )
n
=
0.82 − 0.5
0.32
q
=q
= 3.39
0.25
28
0.25
28
Posto α = 0.05 e α2 = 0.025, si ottiene dalle tavole lo zα/ per cui la P Z ≤ zα/ =
2
2
0.95 + 0.025 = 0.975, ovvero zα/ = 1.96, essendo 3.39 ≥ 1.96 si rifiuta l’ipotesi nulla:
2
l’azienda sembra fare discriminazione di genere.
Posto α = 0.01 e α2 = 0.005, si ottiene dalle tavole lo zα/ per cui la P Z ≤ zα/ =
2
2
0.99 + 0.005 = 0.995, ovvero zα/ = 2.54, essendo 2.54 ≥ 1.96, anche in questo caso,
2
si rifiuta l’ipotesi nulla.
c 2015, ISBN 9788838668852
Fulvia Mecatti, Statistica di base. Come, quando, perché, 2e. 4
Capitolo 19 - Soluzioni degli esercizi
Esercizio 19.8: Soluzione
Dai dati forniti si ottiene il seguente valore sperimentale:
3 X
2
2
2
2
2
X
(9 − 13.18)
(16 − 23.18)
(5 − 16.36)
(fij − fij ∗)
χ =
=
+
+...+
= 23.87
fij ∗
13.18
23.18
16.36
i=1 j=1
2
Mentre si ricava il valore critico dalle tavole, sapendo che (h − 1) (k − 1) = 2 · 1 = 2
gradi di libertà ed α = 0.02: χ22, 0.02 = 7.82.
Essendo 23.87 > 7.82, si rifiuta l’ipotesi di indipendenza fra media dei voti e genere
nella popolazione di interesse a livello di significatività del 98%, ovvero esiste una
relazione significativa tra i due fenomeni.
Esercizio 19.9: Soluzione
Sapendo che: Ŷ = 8.44 + 0.84X; n = 8; Devianza Residua = 6.78; per effettuare
il test è necessario calcolare la stima della media campioanria di X:
n
x̄ =
1
1X
xi = [1 + ... + 8] = 6
n i=1
8
una stima (non distorta) della varianza marginale di X:
s2X =
i 1
1h
2
2
(1 − 4.5) + ... + (8 − 4.5) = [12.25 + ... + 12.25] = 6
7
7
e dalla Devianza Residua si ricava la stima della varianza degli errori:
s2ε =
DR
6.78
=
= 1.13
n−2
6
Posto che α = 0.05 e α2 = 0.025, si ricava dalle tavole della T di Student alla riga
(n − 2) = 6 gradi di libertà e colonna 0.025 il valore critico tα/2 = 2.447, quindi il
valore sperimentale si ricava come:
b̂
0.84
0.84
q =p
=
= 5.25
0.16
1.13/7 × 6
s2ε (n − 1) s2X
che essendo maggiore di 2.447, permette di rifutare l’ipotesi nulla, si conclude che,
con probabilità di sbagliare del 5% il fatturato dell’azienda è modellabile con una
retta con inclinazione positiva (crescente).
c 2015, ISBN 9788838668852
Fulvia Mecatti, Statistica di base. Come, quando, perché, 2e. Capitolo 19 - Soluzioni degli esercizi
5
Esercizio 19.10: Soluzione
Per stimare la retta è necessario ricavere le medie campionarie:
n
x̄ =
1X
1
230
xi = [10 + ... + 50] =
= 28.75
n i=1
8
8
n
ȳ =
1
1473
1X
yi = [195 + ... + 170] =
= 184.13
n i=1
8
8
la stima (non distorta) della covarianza:
sXY =
=
=
=
1
7
1
7
1
7
1
n−1
n
P
(xi − x̄) =
i=1
[(10 − 28.75) (195 − 184.15) + ... + (50 − 28.75) (170 − 184.15)] =
[(−18.75) (10.87) + ... + (21.25) (−14.13)] =
[−203.81 − ... − 300.26] = −976.77
= −139.54
7
e la stima (non distorta) della varianza marginale di X:
n
P
2
1
(xi − x̄) =
s2X = n−1
i=1
h
i
h
i
2
2
2
2
= 17 (10 − 28.75) + ... + (50 − 28.75) = 17 (−18.75) + ... + (21.25) =
= 174.21
= 71 [351.56 + ... + 451.56] = 1219.48
7
quindi si ricavano i coefficienti della retta:
b̂ =
−976.77
= −0.8; â = 184.13 + 0.8 × 28.75 = 207.13;
1219.48
ovvero il seguente modello: Ŷ = 207.13 − 0.8X.
Per effettuare il test sul coefficiente angolare del modello è necessario ricavare anche
la stima della varianza degli errori:
s2ε =
120.55
DR
=
= 20.09
n−2
6
Posto che α = 0.05 e α2 = 0.025, si ricava dalle tavole della T di Student alla riga
(n − 2) = 6 gradi di libertà e colonna 0.025 il valore critico tα/2 = 2.447, quindi il
valore sperimentale si ricava come:
b̂
−0.8
−0.8
q =p
=
= −6.25
0.128
20.09/7 × 174.21
s2ε (n − 1) s2X
c 2015, ISBN 9788838668852
Fulvia Mecatti, Statistica di base. Come, quando, perché, 2e. 6
Capitolo 19 - Soluzioni degli esercizi
che essendo minore di -2.447, permette di rifutare l’ipotesi nulla, si conclude che, con
probabilità di sbagliare del 5% le pulsazioni sotto sforzo sono modellabili con una
retta con inclinazione negativa (decrescente).
Esercizio 19.11: Soluzione
1. Per verificare un’ipotesi sulla media di una popolazione Normale ciò che determina la scelta fra un T-test o uno Z-test è la disponibilità di informazioni sulla
varianza della popolazione: vero.
2. L’indice di connessione χ2 può essere utilizzato come statistica test per verificare
l’indipendenza statistica in una tabella di contingenza campionaria ma si tratta
di un test approssimato per grandi campioni: vero.
3. Lo Z-test serve per verificare ipotesi bilaterali mentre il T-test per verificare
ipotesi unilaterali: falso.
4. Per la verifica dell’indipendenza su dati campionari bivariati i gradi di libertà
del χ2 -test sono il prodotto fra il numero di righe e il numero delle colonne della
tabella: falso.
5. Se si rifiuta l’ipotesi nulla allora l’ipotesi statistica corrispondente è falsa: falso.
6. L’errore di I specie è l’errato rifiuto dell’ipotesi nulla: vero.
7. Il valore critico del test è un valore teorico della statistica test mentre il valore
sperimentale è calcolato sui dati campionari: vero.
8. Eseguire un test con la regione critica o con il p-value può condurre a due
decisioni diverse circa il rifiuto di H0 con lo stesso livello di significatività:
falso.
9. La verifica di H0 : b = 0 sul coefficiente angolare del modello lineare equivale a
verificare l’ipotesi di incorrelazione fra i due fenomeni modellati: vero.
10. Il p-value è il più piccolo α che porta al rifiuto di H0 perciò se p-value ≤ α si
rifiuta: vero.
Esercizio 19.12: soluzione
1. Il livello di significatività del test è: il complemento della probabilità di sbagliare
rifiutando l’ipotesi nulla quando invece è vera.
2. La statistica test è: una variabile casuale che assume come vera l’ipotesi nulla.
c 2015, ISBN 9788838668852
Fulvia Mecatti, Statistica di base. Come, quando, perché, 2e. Capitolo 19 - Soluzioni degli esercizi
7
3. Il p-value è: l’area a destra del valore sperimentale del test.
4. Un test statistico è: una procedura campionaria per decidere se H0 è vera o
falsa.
5. In un test Chi quadrato di indipendenza l’indice χ2 calcolato su una tabella di
contingenza campionaria è: il valore sperimentale del test.
6. Il T-test sul coefficiente angolare b del modello lineare: equivale a un test di
incorrelazione fra le due variabili.
c 2015, ISBN 9788838668852
Fulvia Mecatti, Statistica di base. Come, quando, perché, 2e. 
Scarica