Capitolo 19 Soluzioni degli esercizi a cura di Elena Siletti Esercizio 19.1: Soluzione Utilizzando i dati forniti: x̄ = 30; µ0 = 25; σ 2 = 49; n = 25, si ottiene il seguente valore empirico: 5 x̄ − µ0 30 − 25 5 z= = √ = 7 = 5 × = 3.57 σ √ 7 √49 n 5 25 posto che α = 0.05 e α2 = 0.025, si ottiene dalle tavole lo zα/ per cui la P Z ≤ zα/ = 2 2 1 − 0.025 = 0.975, ovvero zα/ = 1.96, quindi, essendo: 3.57 ≥ 1.96 si rifiuta l’ipotesi 2 nulla, ovvero il tempo che intercorre tra l’assunzione del farmaco e il suo effetto non è di 25 minuti. Il p − value è: P (Z > 3.57) = 1 − Φ (3.57) ∼ = 0 che essendo inferiore all’ α2 scelto, fa sı̀ che si rifiuti l’ipotesi nulla anche con questo metodo. Esercizio 19.2: Soluzione Utilizzando i dati forniti: x̄ = 2.2; µ0 = 2; σ 2 = 0.1; n = 25, si ottiene il seguente valore empirico: z= x̄ − µ0 √σ n = 2.2 − 2 √ √0.1 25 = 0.2 0.32 5 = 0.2 × 5 = 3.125 0.32 posto che α = 0.10 e α2 = 0.05, si ottiene dalle tavole lo zα/ per cui la P Z ≤ zα/ = 2 2 0.90+0.05 = 0.95, ovvero zα/ = 1.65, quindi, essendo: 3.125 ≥ 1.65 si rifiuta l’ipotesi 2 nulla, ovvero che il guasto non abbia modificato il contenuto medio della produzione. Se non si ha la certezza che la varianza sia rimasta invariata, si utilizza s2 = 0.2 ottenendo il seguente valore empirico: t24 = x̄ − µ0 √σ n = 2.2 − 2 √ √0.2 25 = 0.2 0.45 5 = 0.2 × 5 = 2.22 0.45 c 2015, ISBN 9788838668852 Fulvia Mecatti, Statistica di base. Come, quando, perché, 2e. 1 2 Capitolo 19 - Soluzioni degli esercizi posto che α = 0.01 e α2 = 0.005, si ottiene dalle tavole della T di Student con 24 gdl: 24 t24 α = t0.005 = 4.6041 che lascia a destra una probabilità pari a 0.005. 2 Essendo −4.6041 < 2.22 < 4.6041, si accetta l’ipotesi nulla, ovvero che il guasto abbia modificato il contenuto medio della produzione. Posto α = 0.01 e α2 = 0.005, si ottiene dalle tavole lo zα/ per cui la P Z ≤ zα/ = 2 2 0.99 + 0.005 = 0.995, ovvero zα/ = 2.58, quindi, essendo: 3.125 ≥ 2, 58 comunque, 2 anche con un livello di confidenza maggiore, si rifiuta l’ipotesi nulla, ovvero che il guasto non abbia modificato il contenuto medio della produzione. Solo ipotizzando la varianza ignota, si accetterebbe l’ipotesi nulla, mentre anche a livelli di confidenza elevati si rifiuterebbe l’ipotesi che il guasto non abbia modificato il contenuto medio della produzione. Esercizio 19.3: Soluzione Sostituendo i dati forniti dal testo si ottiene il seguente valore empirico: x z = qn − p0 p0 (1−p0 ) n 0.29 − 0.30 −0.01 = q =q = −0.218 0.30·0.70 100 0.21 100 Osservando che il test è unidirezionale, si ricava il valore critico del test: α = 0.05 Si è interessati a conoscere il −zα per cui la P (Z ≤ −zα ) = 0.05, dalle tavole si ottiene zα = 1.65 per cui la P (Z ≤ zα ) = 0.95, che cambiando segno diventa −zα = −1.65. Essendo −0.218 ≥ −1.65 si accetta l’ipotesi nulla, ovvero si ritiene che la differenza osservata sia casuale e non tale da indicare una riduzione significativa dei consensi. Esercizio 19.4: Soluzione Dai dati si ottiene il seguente valore empirico: χ2 = 2 X X fij − fˆij i j fˆij = 657.69 Per un livello di significatività 1 − α = 0.95 e con gdl = (h − 1) (k − 1) = 3 × 3 = 9, si osserva dalle tavole che il valore critico è χ29;0.05 = 16.91 , quindi, essendo 657.69 > 16.91, si rifiuta l’ipotesi nulla di indipendenza. Questo significa che esiste una relazione significativa tra il reddito mensile delle famiglie e la loro dimensione. Esercizio 19.5: Soluzione c 2015, ISBN 9788838668852 Fulvia Mecatti, Statistica di base. Come, quando, perché, 2e. Capitolo 19 - Soluzioni degli esercizi 3 Utilizzando i dati si ottiene il seguente valore empirico: √ x̄ − µ0 25000 − 26000 50 z= = = −1000 × = −70.71 100 √σ √ 100 n 50 z0.05 = −1.64, poiché −70.71 < −1.64, si rifiuta l’ipotesi nulla, ovvero, il processo produttivo deve considerarsi fuori controllo. Esercizio 19.6: Soluzione Utilizzando i dati si ottiene: x̄ = 1 n n P xi = i=1 1483 15 = 98.87; µ0 = 90; n 5621.78 1 X 2 (xi − x̄) = = 401.55; n = 15 s = n − 1 i=1 14 2 ovvero,il valore empirico: t14 = x̄ − µ0 √σ n = 98.87 − 90 √ 401.55 √ 15 √ = 8.87 · √ 15 = 1.714 401.55 14 Posto che α = 0.01, si ottiene dalle tavole della T di Student con 14 gdl: t14 α = t0.01 = 2.624 essendo 1.714 < 2.624 non si rifiuta l’ipotesi nulla, ovvero non ci sono motivi per ritenere che il tempo di attesa sia superiore a 90 giorni. Esercizio 19.7: Soluzione Considerando p, la proporzione di licenziati di sesso femminile: p0 = 0.5; p0 (1 − p0 ) = 0.25; n = 28;p̂ = nx = 23 28 = 0.82; Sostituendo i dati si ottiene il seguente valore osservato: x z = qn − p0 p0 (1−p0 ) n = 0.82 − 0.5 0.32 q =q = 3.39 0.25 28 0.25 28 Posto α = 0.05 e α2 = 0.025, si ottiene dalle tavole lo zα/ per cui la P Z ≤ zα/ = 2 2 0.95 + 0.025 = 0.975, ovvero zα/ = 1.96, essendo 3.39 ≥ 1.96 si rifiuta l’ipotesi nulla: 2 l’azienda sembra fare discriminazione di genere. Posto α = 0.01 e α2 = 0.005, si ottiene dalle tavole lo zα/ per cui la P Z ≤ zα/ = 2 2 0.99 + 0.005 = 0.995, ovvero zα/ = 2.54, essendo 2.54 ≥ 1.96, anche in questo caso, 2 si rifiuta l’ipotesi nulla. c 2015, ISBN 9788838668852 Fulvia Mecatti, Statistica di base. Come, quando, perché, 2e. 4 Capitolo 19 - Soluzioni degli esercizi Esercizio 19.8: Soluzione Dai dati forniti si ottiene il seguente valore sperimentale: 3 X 2 2 2 2 2 X (9 − 13.18) (16 − 23.18) (5 − 16.36) (fij − fij ∗) χ = = + +...+ = 23.87 fij ∗ 13.18 23.18 16.36 i=1 j=1 2 Mentre si ricava il valore critico dalle tavole, sapendo che (h − 1) (k − 1) = 2 · 1 = 2 gradi di libertà ed α = 0.02: χ22, 0.02 = 7.82. Essendo 23.87 > 7.82, si rifiuta l’ipotesi di indipendenza fra media dei voti e genere nella popolazione di interesse a livello di significatività del 98%, ovvero esiste una relazione significativa tra i due fenomeni. Esercizio 19.9: Soluzione Sapendo che: Ŷ = 8.44 + 0.84X; n = 8; Devianza Residua = 6.78; per effettuare il test è necessario calcolare la stima della media campioanria di X: n x̄ = 1 1X xi = [1 + ... + 8] = 6 n i=1 8 una stima (non distorta) della varianza marginale di X: s2X = i 1 1h 2 2 (1 − 4.5) + ... + (8 − 4.5) = [12.25 + ... + 12.25] = 6 7 7 e dalla Devianza Residua si ricava la stima della varianza degli errori: s2ε = DR 6.78 = = 1.13 n−2 6 Posto che α = 0.05 e α2 = 0.025, si ricava dalle tavole della T di Student alla riga (n − 2) = 6 gradi di libertà e colonna 0.025 il valore critico tα/2 = 2.447, quindi il valore sperimentale si ricava come: b̂ 0.84 0.84 q =p = = 5.25 0.16 1.13/7 × 6 s2ε (n − 1) s2X che essendo maggiore di 2.447, permette di rifutare l’ipotesi nulla, si conclude che, con probabilità di sbagliare del 5% il fatturato dell’azienda è modellabile con una retta con inclinazione positiva (crescente). c 2015, ISBN 9788838668852 Fulvia Mecatti, Statistica di base. Come, quando, perché, 2e. Capitolo 19 - Soluzioni degli esercizi 5 Esercizio 19.10: Soluzione Per stimare la retta è necessario ricavere le medie campionarie: n x̄ = 1X 1 230 xi = [10 + ... + 50] = = 28.75 n i=1 8 8 n ȳ = 1 1473 1X yi = [195 + ... + 170] = = 184.13 n i=1 8 8 la stima (non distorta) della covarianza: sXY = = = = 1 7 1 7 1 7 1 n−1 n P (xi − x̄) = i=1 [(10 − 28.75) (195 − 184.15) + ... + (50 − 28.75) (170 − 184.15)] = [(−18.75) (10.87) + ... + (21.25) (−14.13)] = [−203.81 − ... − 300.26] = −976.77 = −139.54 7 e la stima (non distorta) della varianza marginale di X: n P 2 1 (xi − x̄) = s2X = n−1 i=1 h i h i 2 2 2 2 = 17 (10 − 28.75) + ... + (50 − 28.75) = 17 (−18.75) + ... + (21.25) = = 174.21 = 71 [351.56 + ... + 451.56] = 1219.48 7 quindi si ricavano i coefficienti della retta: b̂ = −976.77 = −0.8; â = 184.13 + 0.8 × 28.75 = 207.13; 1219.48 ovvero il seguente modello: Ŷ = 207.13 − 0.8X. Per effettuare il test sul coefficiente angolare del modello è necessario ricavare anche la stima della varianza degli errori: s2ε = 120.55 DR = = 20.09 n−2 6 Posto che α = 0.05 e α2 = 0.025, si ricava dalle tavole della T di Student alla riga (n − 2) = 6 gradi di libertà e colonna 0.025 il valore critico tα/2 = 2.447, quindi il valore sperimentale si ricava come: b̂ −0.8 −0.8 q =p = = −6.25 0.128 20.09/7 × 174.21 s2ε (n − 1) s2X c 2015, ISBN 9788838668852 Fulvia Mecatti, Statistica di base. Come, quando, perché, 2e. 6 Capitolo 19 - Soluzioni degli esercizi che essendo minore di -2.447, permette di rifutare l’ipotesi nulla, si conclude che, con probabilità di sbagliare del 5% le pulsazioni sotto sforzo sono modellabili con una retta con inclinazione negativa (decrescente). Esercizio 19.11: Soluzione 1. Per verificare un’ipotesi sulla media di una popolazione Normale ciò che determina la scelta fra un T-test o uno Z-test è la disponibilità di informazioni sulla varianza della popolazione: vero. 2. L’indice di connessione χ2 può essere utilizzato come statistica test per verificare l’indipendenza statistica in una tabella di contingenza campionaria ma si tratta di un test approssimato per grandi campioni: vero. 3. Lo Z-test serve per verificare ipotesi bilaterali mentre il T-test per verificare ipotesi unilaterali: falso. 4. Per la verifica dell’indipendenza su dati campionari bivariati i gradi di libertà del χ2 -test sono il prodotto fra il numero di righe e il numero delle colonne della tabella: falso. 5. Se si rifiuta l’ipotesi nulla allora l’ipotesi statistica corrispondente è falsa: falso. 6. L’errore di I specie è l’errato rifiuto dell’ipotesi nulla: vero. 7. Il valore critico del test è un valore teorico della statistica test mentre il valore sperimentale è calcolato sui dati campionari: vero. 8. Eseguire un test con la regione critica o con il p-value può condurre a due decisioni diverse circa il rifiuto di H0 con lo stesso livello di significatività: falso. 9. La verifica di H0 : b = 0 sul coefficiente angolare del modello lineare equivale a verificare l’ipotesi di incorrelazione fra i due fenomeni modellati: vero. 10. Il p-value è il più piccolo α che porta al rifiuto di H0 perciò se p-value ≤ α si rifiuta: vero. Esercizio 19.12: soluzione 1. Il livello di significatività del test è: il complemento della probabilità di sbagliare rifiutando l’ipotesi nulla quando invece è vera. 2. La statistica test è: una variabile casuale che assume come vera l’ipotesi nulla. c 2015, ISBN 9788838668852 Fulvia Mecatti, Statistica di base. Come, quando, perché, 2e. Capitolo 19 - Soluzioni degli esercizi 7 3. Il p-value è: l’area a destra del valore sperimentale del test. 4. Un test statistico è: una procedura campionaria per decidere se H0 è vera o falsa. 5. In un test Chi quadrato di indipendenza l’indice χ2 calcolato su una tabella di contingenza campionaria è: il valore sperimentale del test. 6. Il T-test sul coefficiente angolare b del modello lineare: equivale a un test di incorrelazione fra le due variabili. c 2015, ISBN 9788838668852 Fulvia Mecatti, Statistica di base. Come, quando, perché, 2e.