Test di ipotesi

annuncio pubblicitario
26/05/2015
Test di ipotesi
Test
E’ una metodologia statistica che consente di prendere una decisione.
Esempio: Un supermercato riceve dal proprio fornitore l’assicurazione che non più del 5%
delle mele di tipo A dell’ultima fornitura ha un peso inferiore a 150 gr.
In un controllo basato su un campione casuale di 80 esemplari, si trova
che la frazione di mele sottopeso (cioè con un peso inferiore a 150gr)
è 0,06. L’affermazione del fornitore è vera?
Popolazione generatrice: forniture di mele
Parametro di interesse: frazione di mele con peso inferiore o uguale a 150 gr.
Esempio: Si consideri la sperimentazione di un nuovo fertilizzante A, del quale si intende confrontare l’efficacia rispetto ad un fertilizzante tradizionale B. Lo sperimentatore studierà l’effetto di A su un insieme di lotti di terreno e da queste
osservazioni trarrà evidenze per concludere se l’efficacia di A è equivalente
a quella di B o superiore. Se 85 è la resa media (in quintali per ettaro) di un
terreno, con l’uso del fertilizzante B, e da campionamenti effettuati su terreni coltivati con il fertilizzante A, la resa media campionaria è risultata pari
a 84,3, cosa si può concludere circa l’efficacia del nuovo fertilizzante?
Popolazione generatrice: raccolta cereali
Parametro di interesse: resa del terreno uguale o superiore a 85
1
26/05/2015
Ipotesi
Esempio: Il contenuto di Coca-Cola in una singola bottiglia può subire piccole variazioni. I dati
indicano che il contenuto delle bottiglie segue una legge gaussiana con media 33cc e deviazione standard 1,5cc. Oggi, alle 8am, il responsabile del controllo di qualità ha selezionato 16 bottiglie, trovando una media campionaria di 32,87cc.
Il processo è in controllo statistico?
Una ipotesi statistica è una proposizione circa uno o più parametri di una popolazione o circa
la distribuzione di probabilità della variabile aleatoria che descrive la popolazione
Ipotesi nulla: il contenuto medio delle bottiglie di Coca-Cola è 33cc. : = = 33
Ipotesi alternativa: il contenuto medio delle bottiglie di Coca-Cola è diverso da 33cc.
: ≠ = 33
Nelle applicazioni, si cerca di provare che l’ipotesi alternativa è sostenuta dalle osservazioni.
L’ipotesi nulla ha valore strumentale.
: > 85 : ≠ 33
A 2 code
A 1 coda
: = 85 : = 33
Ipotesi composte
: ≠ 85 : > 0,05
Ipotesi semplici
Ipotesi composte
Test di Ipotesi
Si chiama test di ipotesi una procedura che consente di prendere una decisione circa una particolare ipotesi (nulla) a partire dalle informazioni contenute in un campione casuale estratto dalla popolazione in esame.
Se questa informazione è
consistente con l’ipotesi nulla
Se questa informazione non è
consistente con l’ipotesi nulla
è
è
Una ipotesi non potrà mai essere accettata con certezza, ma il risultato del test sarà sempre
accompagnato da una valutazione della possibilità di commettere un errore accettando o
rigettando l’ipotesi.
Formulare l’ipotesi che si vuole sottoporre a verifica
Procedura del test
Selezionare un campione casuale
Calcolare il valore di una statistica del campione utile alla verifica
dell’ipotesi
Usare il valore calcolato per prendere una decisione sulla validità
dell’ipotesi.
2
26/05/2015
Procedura per il test
Esempio: Il contenuto di Coca-Cola in una singola bottiglia può subire piccole variazioni. I dati
indicano che il contenuto delle bottiglie segue una legge gaussiana con media 33cc e deviazione standard 1,5cc. Oggi, alle 8am, il responsabile del controllo di qualità ha selezionato 16 bottiglie, trovando una media campionaria di 32,87cc.
Il processo è in controllo statistico?
Formulare l’ipotesi che si vuole sottoporre a verifica
: = = 33
Selezionare un campione casuale
Oggi, alle 8am, il responsabile del controllo di qualità ha selezionato 16 bottiglie…
Calcolare il valore di una statistica del campione utile alla verifica
̅ = 32,87
Usare il valore calcolato per prendere una decisione sulla validità
dell’ipotesi.
Come?
Usando la stima puntuale?
Usando gli intervalli di confidenza?
Regione di accettazione
Il valore trovato di 32,87cc è sufficientemente vicino a 33cc per stabilire che il processo è in
controllo statistico?
32,87
?
32
= 33
34
Stabilire la distanza massima tale che il valore calcolato per la media campionaria
è ritenuto «sufficientemente vicino» al valore teorico assegnato al parametro media.
La regione critica di un test di ipotesi è quel sottoinsieme (di numeri reali) tale che
si rigetta l’ipotesi nulla , se il valore calcolato della statistica test appartiene a tale regione
si accetta , se il valore calcolato della statistica test non appartiene a tale sottoinsieme.
Si chiama regione di accettazione , ! , il complementare della regione critica.
Esempio: (32,34) è la regione di accettazione
#∞, 32 ⋃ 34, ∞ è la regione critica
Per evitare che la scelta della regione sia soggettiva, è necessario
valutare quali tipi di errori vengono indotti da questa procedura
scegliere la regione critica che minimizzi tali errori
3
26/05/2015
Errori
Un test di ipotesi può condurre a due tipi di errori
̅
Errore di I tipo
Errore di II tipo
Test rigetta Test non rigetta In termini di probabilità:
Test rigetta Test non rigetta ̅
!
&' vera
!
&' falsa
Errore I tipo
Nessun errore
Nessun errore
Errore di II tipo
&' vera
( =P(Errore I tipo)
Nessun errore
&' falsa
Nessun errore
) =P(Errore di II tipo)
Errore di I tipo
( = * +,- è.
Lo sperimentatore rigetta l’ipotesi
nulla (a posteriori e sulla base dei dati)
A priori, l’ipotesi nulla è vera
( = * " "|" è."
1#(
= * " "|" è."
La probabilità di non rigettare l’ipotesi nulla, quando è vera,
rappresenta la probabilità di prendere una decisione corretta.
4
26/05/2015
Errore di II tipo
) = * +,- è23
Lo sperimentatore non rigetta l’ipotesi
nulla (a posteriori e sulla base dei dati)
A priori, l’ipotesi nulla è falsa
) = * " "|" è23"
Se l’ipotesi nulla è falsa, allora è vera l’ipotesi alternativa
) = * " "|"
è."
1 # ) = * " "|"è23"
La probabilità di rigettare l’ipotesi nulla, quando è falsa, rappresenta la
probabilità di prendere una decisione corretta.
Quale errore?
1#(
Errore II tipo
) = * " "|"
è."
= * " "|" è."
Errore I tipo
Esempio: Il contenuto di Coca-Cola in una singola bottiglia può subire piccole variazioni. I dati
indicano che il contenuto delle bottiglie segue una legge gaussiana con media 33cc e deviazione standard 1,5cc. Oggi, alle 8am, il responsabile del controllo di qualità ha selezionato 16 bottiglie, trovando una media campionaria di 32,87cc.
Il processo è in controllo statistico?
Regione di accettazione: (32;34)
: = = 33
Quale dei due errori è possibile calcolare?
* " "|"è." = * 4 ∈ 632; 348| = 33 = * 32 9 4 9 34| = 33
= * 32 # 9 4 # 9 34 # | = 33
=*
32 # 33
1,5/ 16
Se …
9
4 # 33
1,5/ 16
9
34 # 33
1,5/ 16
= * #2,67 9 < 9 2,67
= * 32 # 33 9 4 # 33 9 34 # 33
=*
32 # 33
1,5/ 16
9<9
34 # 33
1,5/ 16
= 0,9962-0,0038=0,9898
( ≅ 1%
5
26/05/2015
Modificando la regione di accettazione, cambia P(errore di I tipo).
In base ai dati dell’esempio: 4~@ 33;
1,5
16
La regione di accettazione:
* 32 9 4 9 34| = 33 =98,9%
Modificando la regione di accettazione, cambia P(errore di I tipo).
In base ai dati dell’esempio: 4~@ 33;
1,5
16
La regione di accettazione:
* 32 9 4 9 34| = 33 =98,9%
Se si sceglie una regione di accettazione
diversa, cosa cambia?
* 32,5 9 4 9 33,5| = 33
Standardizzando ed usando l’ipotesi = 33
* #1,33 9 < 9 1,33
=0,9082 – 0,0918≅82%
6
26/05/2015
Modificando la regione di accettazione, cambia P(errore di I tipo).
In base ai dati dell’esempio: 4~@ 33;
1,5
16
La regione di accettazione:
* 32 9 4 9 34| = 33 =98,9%
Se si sceglie una regione di accettazione
diversa, cosa cambia?
* 32,5 9 4 9 33,5| = 33
Standardizzando ed usando l’ipotesi = 33
* #1,33 9 < 9 1,33
=0,9082 – 0,0918=81%
Se la regione di accettazione viene ulteriormente ampliata:
* 31,5 9 4 9 34,5| = 33 = * #4 9 < 9 4 = 100% per la legge dei 3 sigma.
Modificando la taglia campionaria, cambia P(errore di I tipo).
In base ai dati dell’esempio: 4~@ 33;
La regione di accettazione:
* 32 9 4 9 34| = 33
1,5
16
A parità di regione di accettazione cosa
accade al crescere della taglia?
* 32 9 4 9 34| = 33
= 30
La precisione della media campionaria decrementa da 0,375 a 0,273. Standardizzando:
* #3,65 9 < 9 3,65
=0,9999-0,0001=99%
Per taglia 16 è 98,9%
7
26/05/2015
Modificando la taglia campionaria, cambia P(errore di I tipo).
In base ai dati dell’esempio: 4~@ 33;
1,5
La regione di accettazione:
* 32 9 4 9 34| = 33
16
A parità di regione di accettazione cosa
accade al crescere della taglia?
* 32,5 9 4 9 33,5| = 33
= 30
La precisione della media campionaria decrementa da 0,375 a 0,273. Standardizzando:
* #1,83 9 < 9 1,83
=0,9664-0,0336=93%
Per taglia 16 è 81%
P(errore di I tipo) decrementa al crescere della taglia campionaria.
Per fissare un criterio oggettivo, è possibile fissare la probabilità di commettere l’errore
di I tipo e determinare la regione di accettazione associata a a quella probabilità.
Significatività
La probabilità P(errore di I tipo) viene denominata significatività del test.
Assegnare un valore al livello di significatività del test equivale ad assegnare un valore alla
probabilità di commettere un errore di I tipo.
Assegnare un valore alla probabilità di commettere un errore di I tipo equivale a determinare
gli estremi della regione di accettazione del test.
Come?
(=0,05
1 # (=0,95
* #1,96 9
B4CD
,E/ F
* # 1,96
,E
F
9 1,96 = 0,95
9 4 9 + 1,96
* #1,96 9 < 9 1,96 = 0,95
,E
F
* #1,96
= 0,95
Se l’ipotesi : = = 33 è vera
* 33 # 1,96
,E
F
9 4 9 33 + 1,96
,E
F
,E
F
9 4 # 9 1,96
* 4 # 1,96
,E
F
,E
F
= 0,95
9 9 4 + 1,96
Intervallo di confidenza
= 0,95
,E
F
= 0,95
La regione di accettazione è
(32,27; 33,74)
8
26/05/2015
Come concludere il test: errore di I tipo
La regione di accettazione è (32,27; 33,74)
Osservato un valore per la media campionaria
̅ , si può avere:
°̅ ∈ 632,27; 33,748
L’ipotesi che la media della popolazione è 33cc si
rigetta.
Se l’ipotesi nulla è falsa non si commette alcun
errore.
̅
Se l’ipotesi nulla è vera, si commette un errore di I tipo.
* 32,27 9 4 9 33,74| = 33 = 0,95
Nel concludere che la popolazione non ha media 33cc, si commette un errore solo nel 5%
dei casi, ossia 5 volte su 100 tale conclusione è errata.
Come concludere il test: errore di II tipo
La regione di accettazione è (32,27; 33,74)
Osservato un valore per la media campionaria
̅ , si può avere:
°̅ ∈ 632,27; 33,748
L’ipotesi che la media della popolazione è 33 non
si rigetta.
̅
Se l’ipotesi nulla è vera non si commette alcun
errore.
Se l’ipotesi nulla è falsa, si commette un errore di II tipo.
Quanto vale la probabilità di commettere un errore di II tipo? Ossia con quale probabilità
si prende una decisione errata?
) = * " "|"
è."
Quali sono i valori del parametro nell’ipotesi alternativa?
9
26/05/2015
4~@ 33;
1,5
16
1,5
4~@ 33,5;
16
Errore di II tipo
Probabilità di commettere
un errore di I tipo
Regione critica
* 32,27 9 4 9 33,74| = 33 = 0,95
* 32,27 9 4 9 33,74| = 33,5 =
Probabilità di commettere
un errore di II tipo
Bisogna calcolare l’area in blu
*
*
* 32,27 9 4 9 33,74| = 33,5 = ?
I!,!JCD
,E/ F
9
I!,!JCII,E
,E/ F
B4CD
,E/ F
9
9
B4CD
,E/ F
II,JKCD
|
,E/ F
9
* #3,28 9 < 9 0,64 =
= 33,5 =
II,JKCII,E
,E/ F
=
0,7422-0,0005 = 74%
In generale, l’ipotesi alternativa è una
ipotesi composta. Quale valore scegliere?
10
26/05/2015
Regione di accettazione
32,27 9 4 9 33,74
32,5 9 4 9 33,5
32,27 9 4 9 33,74
32,5 9 4 9 33,5
L
16
1-0,95=0,05
0,729
M: N = OQ
16
1-0,81=0,19
0,497
0,091
30
1-0,99=0,01
0,8
0,169
30
1-0,93=0,07
0,5
0,033
Taglia
M: N = OO, P
0,236
La probabilità P(errore di I tipo) è in relazione con la probabilità P(errore di II tipo). Se una
aumenta l’altra diminuisce e viceversa.
Al crescere della taglia del campione casuale, la probabilità P(errore di II tipo) diminuisce,
mentre per la probabilità P(errore di II tipo) questo non è sempre vero.
La probabilità P(errore di II tipo) diminuisce se il valore assegnato al parametro si allontana
da quello assegnato nell’ipotesi nulla.
Lo statistico seleziona l’errore di I tipo e quindi la regione critica.
Rigettare : = = 33
L’errore di II tipo dipende dal vero valore del parametro in esame, che in genere è incognito.
Pertanto si procede per tentativi.
Accettare : = = 33
Esempio: Si ipotizza che l’età media dei frequentatori di una biblioteca
sia 39 anni con una varianza di 10,2 anni. Per verificare tale ipotesi vengono campionati 100 frequentatori e la loro età media risulta essere 38
anni. Si verifichi l’ipotesi iniziale assumendo che la popolazione generatrice è normale.
Identificare il parametro di interesse: il parametro media Formulare l’ipotesi nulla : = = 39.
Formulare l’ipotesi alternativa
: ≠ = 39.
Scegliere un opportuno errore di I tipo: ( = 0,05.
Scegliere un’opportuna statistica test: 4 .
Costruire la regione di accettazione:
* 9 4 9 ! | = 39
*
# 39
10,2S
100
9<9
! # 39
10,2S
100
*
# 10,2S
100
# 39
9<9
10,2S
100
! # T
10,2S
100
= #U
CV/! = 39
! # 39
10,2S
100
= U
CV/!
11
26/05/2015
# 39
10,2S
100
! # 39
= #U
CV/! = #1,96
10,2S
100
= 39 # 1,96
! = 39 + 1,96
= U
CV/! = 1,96
10,2
= 38,37
100
10,2
= 39,62
100
Determinare un campione casuale e valutare una stima puntuale della statistica
test: ̅ = 38.
Decidere se rigettare o meno l'ipotesi nulla, verificando se tale stima puntale
appartiene o meno alla regione di accettazione: 38 ∈ 638,37; 39,628.
Poiché 38 non appartiene alla regione di accettazione, l’ipotesi nulla si rigetta. La decisione
comporta un errore di I tipo con livello di significatività del 5%, ossia nel 5% dei casi la decisione presa è errata.
Non si può ritenere pari a 39 il numero medio di anni dei frequentatori della biblioteca.
E’ possibile effettuare un secondo test, scegliendo tra le due ipotesi: 9 39 > 39.
: > = 39.
Quale?
L’obbiettivo è rigettare
l’ipotesi nulla.
Poiché la media campionaria è 38, è verosimile che 9 39.
Ipotesi nulla composta
Esempio: Si ipotizza che l’età media dei frequentatori di una biblioteca
sia 39 anni con una varianza di 10,2 anni. Per verificare tale ipotesi vengono campionati 100 frequentatori e la loro età media risulta essere 38
anni. Si verifichi l’ipotesi iniziale assumendo che la popolazione generatrice è normale.
Identificare il parametro di interesse: il parametro media Formulare l’ipotesi nulla : > = 39.
Formulare l’ipotesi alternativa
: W = 39.
Scegliere un opportuno errore di I tipo: ( = 0,05.
Regione critica a una coda
Scegliere un’opportuna statistica test: 4 .
Costruire la regione di accettazione:
Regione critica a due code
!
Quale eliminiamo?
Se si osserva un valore della media campionaria ̅ minore di allora è verosimile ritenere l’ipotesi nulla falsa. Quindi la regione di accettazione ha la forma , ∞ .
Come calcolare il valore di ?
12
26/05/2015
Il valore di è tale che * 4 > | X 39 = 0,95 dove 4~@ 39;
=?
10,2
100
La linea blu rappresenta la pdf di 4~@ 39,3;
L’area blue
è minore
10,2
100
dell’area sottesa dalla II curva
* 4 > | = 39 W * 4 > | = 39,3
P(errore di I tipo con = 39) X P(errore di I tipo con = 39,3)
La regione di accettazione calcolata con = 39 corrisponde al massimo errore di I tipo
richiesto per il test, cioè 0,05.
Come calcolare il valore ?
Standardizzando si ha:
# * <>
= 39
T
10,2S
100
Il valore di è tale che * 4 > | = 39 = 0,95
= * <>
# 39
10,2S
100
= 39 # 1,64 Z
# 39
10,2S
100
= U,E = -1,64
10,2
= 38,48
100
Per ritenere vera l’ipotesi nulla: > = 39 è necessario osservare un valore per la
media campionaria superiore a 38,48.
Poiché il valore osservato 38 ∈ 38,48; ∞ ,l’ipotesi nulla viene rigettata in favore di quella
alternativa.
L’età media dei frequentatori della biblioteca è inferiore a 39 anni con una significatività
del 5%.
13
26/05/2015
P-value
Il p-value rappresenta l’area a destra per il valore osservato della statistica test, assumendo
vera l’ipotesi nulla. (NB: Il suo calcolo dipende però dall’ipotesi alternativa).
Esempio: Si ipotizza che l’età media dei frequentatori di una biblioteca
sia 39 anni con una varianza di 10,2 anni. Per verificare tale ipotesi vengono campionati 100 frequentatori e la loro età media risulta essere 38
anni. Si verifichi l’ipotesi iniziale assumendo che la popolazione generatrice è normale.
Se l’ipotesi nulla : = = 39 è vera, allora
4~@ 39;
10,2
100
Un valore osservato appartenente al range
^ è 38.
di Il p-value è l’area in rosso nel grafico.
L’area in rosso è inferiore alla somma dell’area
in rosso e dell’area blu, poiché 38 non appartiene
alla regione di accettazione.
E’ un altro modo per verificare se l’ipotesi nulla va rigettata.
Se è vera l’ipotesi nulla, allora 4~@ 39;
10,2
100
Impossibile v isualizzare l'immagine.
P-value=* 4938| = 39 + * 4 >40| = 39
= * <9
= * <9
38 # T
10,2S
100
38 # 39
10,2S
100
= * < 9 #3,13
= 39
+
+
* <>
* <>
40 # T
10,2S
100
40 # 39
10,2S
100
= 39
Si noti l’uguaglianza
delle due probabilità
+ * < > 3,13 = 0,0008+(1-0,9992)=2*0,0008=0,0016
Impossibile v isualizzare l'immagine.
Impossibile v isualizzare l'immagine.
Poiché p-value < (=0,05→ 38` → a 3,3
14
26/05/2015
Se il valore osservato per la media campionaria è ad esempio 40, il calcolo del p-value
resta immutato.
Se ̅ > → # ., = 2* 4 > ̅ | = # ., 9 ( → 3 : = # ., > ( → 3 : = Se ̅ 9 → # ., = 2* 4 9 ̅ | = # ., 9 ( → 3 : = # ., > ( → 3 : = Cosa accade se si effettua un test a una coda?
Regione di accettazione nel caso : > = 39.
Poichè ̅ = 38 9 = 39
p#., = * 4 9 ̅ | = P-value=* 4938| = 39 = 0,0008<0,05
Potenza del test
Per migliorare la performance di un test di ipotesi, l’altro parametro su cui è possibile fare
leva è la taglia campionaria.
Visto che il livello di significatività di un test è fissato dallo sperimentatore, è possibile
scegliere una taglia campionaria che diminuisca la probabilità di commettere un errore
di II tipo, ossia aumenti il suo complementare, anche detto potenza di un test.
1 # ) = * " "|"è23"
n
Errore
campionario
Regione
accettazione
30
0,58
(37,86;40,14)
60
0,41
(38,19;39,81)
100
0,32
(38,37;39,63)
150
0,26
(38,49;39,51)
170
0,24
(38,52;39,48)
200
0,23
(38,56;39,44)
Se si rigetta l’ipotesi nulla
Se non si rigetta l’ipotesi nulla
N = Ob, O
N = Ob, c
N = Ob, d
0,23
0,40
0,59
0,76
0,81
0,87
0,11
0,16
0,24
0,34
0,37
0,43
0,05
0,06
0,06
0,07
0,07
0,07
Calcolo della potenza del test
Calcolo dell’errore di II tipo del test
15
26/05/2015
Sul formulario
Test sulla media, popolazione gaussiana, varianza nota
: = : ≠ : > : W : 9 : X Regione di accettazione
#U
CV
!
e
e
; +U
CV
! #U
CV
e
;∞
#∞; +U
CV
e
Test sulla media, popolazione gaussiana, varianza incognita
Quale dei parametri presenti nella regione di accettazione va modificato?
Scegliere un’opportuna statistica test: 4 .
Costruire la regione di accettazione:
In questa costruzione….
Mentre con la varianza nota, la standardizzazione comporta l’uso di una gaussiana standard
# ! # *
9<9
= * 9 4 9 ! | = e !S
e !S T
con la varianza incognita, la standardizzazione comporta l’uso di una v.a. T-Student
* 9 4 9 ! | = *
# f !S
9
4 # f !S
9
! # f !S
T
= Regione di accettazione
: = : ≠ : > : W : 9 : X #
CV;gC
!
#
CV;g
f
f
; +
CV ;gC
!
f
∞
#∞; +
CV;g
f
La regione di accettazione
può essere costruita a partire
dall’intervallo di confidenza
NB: Intervallo di confidenza
4 #
CV ;gC
!
f
f
; 4 +
CV;gC
!
In che modo?
16
26/05/2015
Esempio: Il contenuto di Coca-Cola in una singola bottiglia può subire piccole variazioni. I dati
indicano che il contenuto delle bottiglie segue una legge gaussiana con media 33cc. Oggi, alle
8am, il responsabile del controllo di qualità ha selezionato 16 bottiglie, trovando una media
campionaria di 32,87cc e una deviazione standard campionaria di 1,5 cc .
Stabilire se il contenuto medio delle bottiglie è variato al livello di significatività del 5%.
Identificare il parametro di interesse: il parametro media Formulare l’ipotesi nulla : = = 33.
Formulare l’ipotesi alternativa
: ≠ = 33.
Scegliere un opportuno errore di I tipo: ( = 0,05.
Scegliere un’opportuna statistica test: 4 .
Costruire la regione di accettazione (formulario):
#
CV ;gC
!
f
f
; +
CV ;gC
!
33 # 2,1314 Z
1,5
16
(=0,05
; 33 + 2,1314 Z
1,5
1 # (/2=0,975
,hJE;
E = 2,1314
32,21; 33,8
16
Prendere una decisione circa l’ipotesi nulla:
f=1,5
= 16
32,87∈ 32,21; 33,8
Decidere se rigettare o meno l'ipotesi nulla, verificando se 32,87 appartiene
o meno alla regione di accettazione: 32,21; 33,8
Poiché 32,87 appartiene alla regione di accettazione, l’ipotesi nulla non si rigetta.
0,95
= * " "|" è."
* " "|" è23" =? Errore II tipo
Calcolare l’errore di II tipo per vari valori di * " "| = 32,5 =
* 32,21 9 4 9 33,8| = 32,5
*
32,21 # 32,5
33,8 # 32,5
9 j
E 9
1,5
1,5
i
i
16
16
= *
33,8 # 32,21 # 9 j
E 9
k = 32,5
1,5
1,5
i
i
16
16
= * #0,77 9 j
E 9 3,46 ≅ 0,99 #0,25=0,74
17
26/05/2015
Sul formulario
Test sulla media, popolazione non gaussiana, varianza nota
: = : ≠ Regione di accettazione
#U
CV/!
: > : W #U
CV
e
e
; +U
CV/!
e
;∞
Per il teorema del
limite centrale
: 9 : X #∞; +U
CV
e
Test sulla media, popolazione non gaussiana, varianza incognita
: = : ≠ Per il teorema del limite
centrale + approssimazione
con una v.a. T-student
Regione di accettazione
#U
CV/!
: > : W #U
CV
f
f
; +U
CV/
f
;∞
: 9 : X #∞; +U
CV
f
Test sulle percentuali
Esempio: Alle ultime elezioni politiche, in un certo seggio hanno votato 1000 persone. Si sa che
nelle precedenti elezioni, il partito A aveva ricevuto il 51% delle preferenze. A 100 cittadini all’
uscita dal seggio elettorale viene chiesto per quale partito hanno votato. Risulta che il partito A
ha ricevuto il 52,3% delle preferenze. E’ possibile ritenere che anche nelle ultime elezioni le
preferenze per il partito A prevalgano su quelle agli altri partiti?
Identificare il parametro di interesse: il parametro percentuale
Formulare l’ipotesi nulla : 9 = 0,51.
Formulare l’ipotesi alternativa
: X = 0,51.
Scegliere un opportuno errore di I tipo: ( = 0,05.
Scegliere un’opportuna statistica test: 4 6-,U,8
Costruire la regione di accettazione:
Se si considera l’intervallo di confidenza
la regione di accettazione (a due code) si ottiene da e ! sostituendo al posto di ̂ il valore
del parametro = 0,51. La regione di accettazione a una coda per il test proposto è dunque:
#∞, ! con
*6< 9 1,648 = 0,95 → ! = 0,51 + 1,64 Z
,E
Z6
C,E
8
= 0,5919
18
26/05/2015
Decidere se rigettare o meno l'ipotesi nulla, verificando se 0,523 appartiene
o meno alla regione di accettazione: #∞; 0,5919
Poiché 0,523 appartiene alla regione di accettazione, l’ipotesi nulla non si rigetta.
0,95 = * " "|" è."
* " "|" è23" =?
Errore II tipo
Per quale valore di n l’ipotesi nulla verrebbe rigettata?
! = 0,51 + 1,64 Z
0,51 Z 61 # 0,518
9 0,523
0,2499
0,523 # 0,51
9
1,64
!
> 0,2499/
0,013
1,64
0,51 Z 61 # 0,518 0,523 # 0,51
9
1,64
!
=3978
Test sulla percentuale Regione di accettazione
: = : ≠ : > : W # U
CV/! Z
Z 61 # 8
Z 61 # 8
; ̂ + U
CV/! Z
Z 61 # 8
; ∞
# U
CV Z
Test sulla varianza
Esempio: L’osservazione della durata (in ore) della batteria per cellulare di una data marca
in 24 esemplari di prodotto ha dato luogo ai seguenti risultati:
58,7
71,5
64,9
75,4
76,9
67,3
67,8
73,0
41,7 56,7 64,5 69,7 82,1 82,5 40,8
70,4 104 82,3 90,4 86,8 72,8 71,8
74,9
54,5
La varianza campionaria risulta 203,45. E’ possibile ritenere valida l’ipotesi che
la variabilità della durata delle batterie sia 200?
Identificare il parametro di interesse: lavarianzae !
Formulare l’ipotesi nulla : e ! = e ! = 200
Formulare l’ipotesi alternativa
: e ! ≠ e ! = 200.
Scegliere un opportuno errore di I tipo: ( = 0,05.
Scegliere un’opportuna statistica test:f ! .
Costruire la regione di accettazione:
Poichè
19
26/05/2015
=11,68
← 24, f ! ← 203,45
=38,07
Decidere se rigettare o meno l'ipotesi nulla, verificando se 203,47 appartiene
o meno alla regione di accettazione: 101,56; 331,04
Poiché 203,47 appartiene alla regione di accettazione, l’ipotesi nulla non si rigetta.
0,95
= * " "|" è."
* " "|" è23" =?
Test sulla varianza
: e ! = e ! : e ! ≠ e ! : e ! > e ! : e ! W e ! Errore II tipo
Regione di accettazione
: e ! 9 e ! : e ! X e ! 20
Scarica