Test di ipotesi sulla legge di distribuzione
Probabilità e Statistica - a.a. 04/05 - test sulla distribuzione
1
Test chi-quadrato
• Sia noto un campione casuale di taglia n estratto da una popolazione con distribuzione incognita.
• Le n osservazioni sono dislocate in k classi (istogramm a di frequenza).
• Sia Oi il numero di osservazioni nella classe i − esima.
• Da una possibile distribuzione di probabilità (che avrebbe generato il campione) si valuta Ei , il
numero di osservazioni attese nella classe i − esima ( Ei = npi = nP(X ∈ classe i-esima)).
(Oi − Ei )2
ha distribuzione chi - quadrato con gradi di
Ei
i =1
k
• Si dimostra che la variabile aleatoria ∑
libertà pari a k − p − 1, dove p rappresenta il numero di parametri stimati per determinare i para metri incogniti della popolazione.
Ipotesi
 H 0 : Oi = Ei , i = 1,2,...k

 H 1 : Oi ≠ Ei , i = 1,2,..., k
Statistica test
χ2 = ∑
k
(Oi − Ei )2
i =1
Ei
Regione Accettazione (una coda) P (χ 2 ≤ χ α2 ,k − p −1 ) = 1 − α
Probabilità e Statistica - a.a. 04/05 - test sulla distribuzione
Regola
del
pollice
2
Esercizio: Il numero di difetti in un circuito stampato segue, per ipotesi, una distribuzione di Poisson. E’ stato selezionato un campione di 60 circuiti, su 32 non sono
stati rilevati difetti, su 15 un solo difetto, su 9 due difetti e 3 difetti sui rimanenti.
Stabilire se l’ipotesi sulla distribuzione è consistente con i dati raccolti.
A) Determinare il parametro incognito della popolazione sotto verifica. λ=0,75.
B) Determinare le frequenze teoriche
Classi
0
1
2
3
Freq. Oss. Freq. Teor.
32 28,34199316
15 21,25649487
9 7,971185578
4 2,430326385
C) Determinare il valore della statistica test: 3.46
D) Determinare il quantile: 5.99
Probabilità e Statistica - a.a. 04/05 - test sulla distribuzione
3
Esercizio: La tabella fornisce la pressione sanguigna sistolica per un campione casuale
di 250 uomini di età compresa tra i 30 e i 40 anni. Stabilire se i dati seguono una distribuzione gaussiana sapendo che la media campionaria è 130 e la deviazione campionaria
è 14.
Pressione
80<x100
100<x<110
110<x<120
120<x<130
130<x<140
140<x<150
150<x<160
160<x<180
Freq. Oss.
3
12
52
74
67
26
12
4
250
Cumulative
0,016062228
0,076563771
0,237525188
0,5
0,762474812
0,923436229
0,983937772
1
Prob.
0,016062
0,060502
0,160961
0,262475
0,262475
0,160961
0,060502
0,016062
1
Freq. Teor
4,015557
15,12539
40,24035
65,6187
65,6187
40,24035
15,12539
4,015557
250
Il valore della statistica test è 11,12
Il quantile è 11.07
Probabilità e Statistica - a.a. 04/05 - test sulla distribuzione
4
Test di Kolmogorov-Smirnov
Scopo: verificare se esiste una differenza significativa tra la funzione
di ripartizione empirica costruita per il campione casuale e la funzione
di ripartizione di un modello teorico.
FX ( xi ) − Fˆ (xi )
Statistica: D = i =max
1, 2 ,..., n
# di elementi del campione ≤ xi
Fˆ (xi ) =
n
Per n ≤ 35 si usano le tavole, per n > 35 si usano i valori
D=
1.36
per α = 0.05 e
n
D=
1.63
per α = 0.01
n
NB: questo test è più potente del test chi-quadrato.
Probabilità e Statistica - a.a. 04/05 - test sulla distribuzione
5
Esercizio: Supponiamo di voler verificare l’ipotesi che una certa popolazione abbia distribuzione esponenziale con legge
 x 
F ( x ) = 1 − exp −
, x > 0
 100 
Che conclusioni si possono trarre se un campione ordinato di numerosità 10
mostra i seguenti valori?
66 72 81 94 112 116 124 140 145 155
66
72
81
94
112
116
124
140
145
155
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
0,483149 -0,38315
0,513248 -0,31325
0,555142 -0,25514
0,609372 -0,20937
0,67372 -0,17372
0,686514 -0,08651
0,710616 -0,01062
0,753403 0,046597
0,76543 0,13457
0,787752 0,212248
Probabilità e Statistica - a.a. 04/05 - test sulla distribuzione
Stat. test
6
n
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
25
30
35
0,10
0,776
0,642
0,564
0,51
0,47
0,438
0,411
0,388
0,368
0,352
0,338
0,325
0,314
0,304
0,295
0,286
0,278
0,272
0,264
0,24
0,22
0,21
0,05
0,842
0,708
0,624
0,565
0,521
0,486
0,457
0,432
0,41
0,391
0,375
0,61
0,349
0,338
0,328
0,318
0,309
0,301
0,294
0,27
0,24
0,23
0,01
0,929
0,828
0,733
0,669
0,618
0,577
0,543
0,514
0,49
0,468
0,45
0,433
0,418
0,404
0,392
0,381
0,371
0,363
0,356
0,32
0,29
0,27
Tavole per il test di
Kolmogorov-Smirnov
Probabilità e Statistica - a.a. 04/05 - test sulla distribuzione
7