STATISTICA ESERCITAZIONE 13 Errore di I tipo: si commette se l

STATISTICA ESERCITAZIONE 13
Dott. Giuseppe Pandolfo
9 Marzo 2015
Errore di I tipo: si commette se l'ipotesi nulla H0 viene rifiutata quando essa è vera
Errore di II tipo: si commette se l'ipotesi nulla H0 viene accettata quando essa è falsa
Esercizio 1
Supponiamo che la spesa mensile per l'affitto di un locale commerciale ( ) si distribuisce come
una Normale con
con
. Selezionando n = 40 locali si osserva che
euro.
Verifichiamo che
euro. Accettiamo H0 con
?
Soluzione
Il sistema di ipotesi é:
Calcoliamo
Siccome
rifiutiamo l'ipotesi nulla
In maniera equivalente:
1
Visto che
rifiutiamo H0.
Utilizziamo anche l'approccio basato sul p-value.
Ora l'ipotesi nulla Ho viene rifiutata se
Vediamo che
e dunque rifiutiamo Ho.
Esercizio 2 (Cicchitelli)
Per la generica voce di un inventario di un’impresa mercantile sia X la variabile casuale valore
inventariato - valore certificato. Un certificatore contabile estrae a sorte un campione di 120 voci
ottenendo
= 25,3 e
= 13240. Sia µ la media di X nella popolazione.
a) Si sottoponga a verifica l’ipotesi che µ = 0 contro l’alternativa µ > 0, cioè che
l’inventario è gonfiato, con α = 0.01;
b) Si calcoli la probabilità dell’errore di I tipo;
c) Si calcoli la probabilità di errore di II tipo nel caso di ipotesi alternativa H1: µ = 27
d) Si calcoli la potenza del test;
e) Senza fare i calcoli, e considerando i risultati del punto d) spiegare come cambierebbe la
potenza del test se l’ipotesi alternativa è H1: µ = 27.
2
Soluzione
a)
1. Definizione del sistema di ipotesi:
2. Livello di significatività α = 0,01
3. Costruzione della statistica test
Trattandosi di un campione di dimensione elevata, per il Teorema del Limite Centrale si può
ricorrere all’approssimazione normale e considerare S2 una buona stima della varianza della
popolazione.
4. Definizione della regola di decisione (regione di rifiuto) Il livello di significatività è α = 0.01, il
test è a una coda, quindi
Se
rifiutiamo l’ipotesi nulla o equivalentemente
(1)
5. A partire dal campione calcolo il valore della statistica sotto l’ipotesi nulla
6. Decisione
Siccome
rifiuto l’ipotesi nulla.
b) la probabilità dell’errore di I tipo è α = 0.01
c) Si definisce errore di II tipo la probabilità di non rifiutare l’ipotesi nulla quando è vera l’ipotesi
alternativa, ossia nel nostro caso:
3
A partire dall’ipotese alternativa proposta µ1 = 27 (che da quindi luogo ad una distribuzione
alternativa), la probabilità dell’errore di II tipo è data da:
d) La potenza del test è la probabilità di rifiutare correttamente
, in pratica la probabilità di
prendere la “decisione giusta” e può essere espressa, in termini standardizzati, come:
dove β è la probabilità di non rifiutare
anche se è vera
.
Potenza del test
Nota: un test ha potenza maggiore se la dimensione campionaria è grande, se la discrepanza vera
dall’ipotesi nulla è grande e se la variabilità nella popolazione è bassa.
e) Specificando
= 28 la probabilità dell’errore di II tipo si riduce e aumenta la potenza del test.
Esercizio 3 (ANOVA confronto tra medie)
Applicare l'analisi della varianza ai dati in tabella e effettuare il test per il confronto tra medie.
X
Y
A
17,4
10,4
20,0
B
57,1
25,7
19,9
C
20,5
12,8
22,3
4
Soluzione

Medie parziali

Scarti quadratici medi parziali

Media generale

Devianza tra gruppi

Devianza entro gruppi

Devianza totale
5
Definizione del sistema di ipotesi:
Fonte di variazione
Dev(SQ)
gdl
Tra i gruppi (DevEST)
588,15
2
Entro i gruppi (DevINT)
30,01
6
Totale
618,16
8
VAR(MQ)
F
Siccome
rifiutiamo H0.
Esercizio 4 (ANOVA per regressione)
Y
X
2,3
7
4
11
3,3
10,4
5
9
1) Stimare i coefficienti di regressione;
2) Calcolare l'indice di bontà di adattamento del modello di regressione;
6
3) Costruire la tabella ANOVA della regressione;
4) Verificare la significatività del modello usando il test sul coefficiente di regressione e il test F a
partire dalla tabella ANOVA.
Soluzione
Fonte Variabilità
Dev(ss)
gdl
Var(MS)
Regressione
Dev(R)
1
Dev(R)
Errore
Dev(E)
n-2
Totale
Dev(Y)
n-1
Statistica F
1)
2)
7
3)
Ora sapendo che
Per cui:
Quindi
da cui:
A questo punto calcoliamo Tn:
La statistica F si ottiene:
Fonte Variabilità
Dev(ss)
gdl
Var(MS)
Statistica F
Regressione
0,89
1
0,89
3,83
Errore
2,99
2
1,49
Totale
3,88
3
8
4)
Sistema di ipotesi:
con
Sappiamo che
Siccome
allora accettiamo H0.
Esercizio 5
Il valore dell'indice di connessione del chi-quadrato per i dati in tabella è 8,95.
Condizione
Vaccino
Sani
Malati
Totale
Si
43
7
50
No
86
14
100
Totale
129
21
150
Effettuare un test del chi-quadrato per l'indipendenza con un livello di significatività del 10%.
Soluzione
Sappiamo che
9
Il sistema di ipotesi è:
Il valore dell'indice di connessione va confrontato con
, considerando anche il livello
di significatività, nel nostro caso
Utilizzando le tavole
Rifiutiamo H0 se
Siccome
Rifiutiamo H0, e possiamo affermare che vi è relazione significativa con probabilità del 90%.
10