Test di ipotesi sulla legge di distribuzione Probabilità e Statistica - a.a. 04/05 - test sulla distribuzione 1 Test chi-quadrato • Sia noto un campione casuale di taglia n estratto da una popolazione con distribuzione incognita. • Le n osservazioni sono dislocate in k classi (istogramm a di frequenza). • Sia Oi il numero di osservazioni nella classe i − esima. • Da una possibile distribuzione di probabilità (che avrebbe generato il campione) si valuta Ei , il numero di osservazioni attese nella classe i − esima ( Ei = npi = nP(X ∈ classe i-esima)). (Oi − Ei )2 ha distribuzione chi - quadrato con gradi di Ei i =1 k • Si dimostra che la variabile aleatoria ∑ libertà pari a k − p − 1, dove p rappresenta il numero di parametri stimati per determinare i para metri incogniti della popolazione. Ipotesi H 0 : Oi = Ei , i = 1,2,...k H 1 : Oi ≠ Ei , i = 1,2,..., k Statistica test χ2 = ∑ k (Oi − Ei )2 i =1 Ei Regione Accettazione (una coda) P (χ 2 ≤ χ α2 ,k − p −1 ) = 1 − α Probabilità e Statistica - a.a. 04/05 - test sulla distribuzione Regola del pollice 2 Esercizio: Il numero di difetti in un circuito stampato segue, per ipotesi, una distribuzione di Poisson. E’ stato selezionato un campione di 60 circuiti, su 32 non sono stati rilevati difetti, su 15 un solo difetto, su 9 due difetti e 3 difetti sui rimanenti. Stabilire se l’ipotesi sulla distribuzione è consistente con i dati raccolti. A) Determinare il parametro incognito della popolazione sotto verifica. λ=0,75. B) Determinare le frequenze teoriche Classi 0 1 2 3 Freq. Oss. Freq. Teor. 32 28,34199316 15 21,25649487 9 7,971185578 4 2,430326385 C) Determinare il valore della statistica test: 3.46 D) Determinare il quantile: 5.99 Probabilità e Statistica - a.a. 04/05 - test sulla distribuzione 3 Esercizio: La tabella fornisce la pressione sanguigna sistolica per un campione casuale di 250 uomini di età compresa tra i 30 e i 40 anni. Stabilire se i dati seguono una distribuzione gaussiana sapendo che la media campionaria è 130 e la deviazione campionaria è 14. Pressione 80<x100 100<x<110 110<x<120 120<x<130 130<x<140 140<x<150 150<x<160 160<x<180 Freq. Oss. 3 12 52 74 67 26 12 4 250 Cumulative 0,016062228 0,076563771 0,237525188 0,5 0,762474812 0,923436229 0,983937772 1 Prob. 0,016062 0,060502 0,160961 0,262475 0,262475 0,160961 0,060502 0,016062 1 Freq. Teor 4,015557 15,12539 40,24035 65,6187 65,6187 40,24035 15,12539 4,015557 250 Il valore della statistica test è 11,12 Il quantile è 11.07 Probabilità e Statistica - a.a. 04/05 - test sulla distribuzione 4 Test di Kolmogorov-Smirnov Scopo: verificare se esiste una differenza significativa tra la funzione di ripartizione empirica costruita per il campione casuale e la funzione di ripartizione di un modello teorico. FX ( xi ) − Fˆ (xi ) Statistica: D = i =max 1, 2 ,..., n # di elementi del campione ≤ xi Fˆ (xi ) = n Per n ≤ 35 si usano le tavole, per n > 35 si usano i valori D= 1.36 per α = 0.05 e n D= 1.63 per α = 0.01 n NB: questo test è più potente del test chi-quadrato. Probabilità e Statistica - a.a. 04/05 - test sulla distribuzione 5 Esercizio: Supponiamo di voler verificare l’ipotesi che una certa popolazione abbia distribuzione esponenziale con legge x F ( x ) = 1 − exp − , x > 0 100 Che conclusioni si possono trarre se un campione ordinato di numerosità 10 mostra i seguenti valori? 66 72 81 94 112 116 124 140 145 155 66 72 81 94 112 116 124 140 145 155 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1 0,483149 -0,38315 0,513248 -0,31325 0,555142 -0,25514 0,609372 -0,20937 0,67372 -0,17372 0,686514 -0,08651 0,710616 -0,01062 0,753403 0,046597 0,76543 0,13457 0,787752 0,212248 Probabilità e Statistica - a.a. 04/05 - test sulla distribuzione Stat. test 6 n 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 25 30 35 0,10 0,776 0,642 0,564 0,51 0,47 0,438 0,411 0,388 0,368 0,352 0,338 0,325 0,314 0,304 0,295 0,286 0,278 0,272 0,264 0,24 0,22 0,21 0,05 0,842 0,708 0,624 0,565 0,521 0,486 0,457 0,432 0,41 0,391 0,375 0,61 0,349 0,338 0,328 0,318 0,309 0,301 0,294 0,27 0,24 0,23 0,01 0,929 0,828 0,733 0,669 0,618 0,577 0,543 0,514 0,49 0,468 0,45 0,433 0,418 0,404 0,392 0,381 0,371 0,363 0,356 0,32 0,29 0,27 Tavole per il test di Kolmogorov-Smirnov Probabilità e Statistica - a.a. 04/05 - test sulla distribuzione 7