Le statistiche di conformità X 02 , X 02 , W 02 , W 02 , V 02 nell’universo ridotto o condizionato dei campioni bernoulliani di ordine n (1) Conformity Statistics X 02 , X 02 , W 02 , W 02 , V 02 in the reduced or conditional Universes of Bernoulli Samples of the Order n Giampaolo Zanardi Università Ca’ Foscari di Venezia - Dipartimento di Statistica San Polo 2347, 30125 Venezia – e-mail: [email protected] Abstract: In a recent paper we drew a work scheme to study, under the null hypotesis, in the reduced or conditional universe of Bernoulli samples of the order n, five conformity statistics, two of which based on the distribution of frequencies and three on the distribution of frequencies and quantities for the k modality classes. In this paper we present the final results we have attained in the theoretical determination of the mean values and the variances of said statistics under the null hipothesis subject to verification. Keywords: Statistical distributions, Frequencies, Quantities, Sampling, Mean sample random variables, Tests of fit. 1. Le statistiche di conformità X 02 , X 02 , W 02 , W 02 , V 02 nell’universo ridotto o condizionato dei campioni bernoulliani di ordine n In un recente articolo (v. Zanardi 1998) abbiamo tracciato uno schema di lavoro per studiare, sotto l’ipotesi nulla, nell’universo ridotto o condizionato dei campioni bernoulliani di ordine n, le statistiche di conformità (2): X 02 X 02i ( N 0i 1 0i ) 2 /1 0i (1) X 02 X 02i ( N 0i 1 0i ) 2 / N 0i (2) W02 W02i (1 M i 1 i ) 2 / Var1M i (3) W02 W02i (1M i 1i ) 2 /( i2 / N 0i ) (4) V0 V02i (1M i 1i ) 2 /( i2 /1 i ) (5) i i i i i i i i i i (1) Lavoro prodotto nell’ambito del programma di ricerca di rilevante interesse nazionale “Metodologie e modelli per l’inferenza induttiva e decisionale” cofinanziato dal Murst (1997). (2) La simbologia utilizzata in questa memoria è quella introdotta nel nostro articolo del 1998 al quale rinviamo per ogni chiarimento. in cui 1i e 2i sono la media e la varianza della distribuzione parziale della classe iesima [i ={1,2,…, k}] della popolazione, 1Mi è lo stimatore di 1i ossia la vcc descritta dalla media aritmetica della classe i del campione (classificato) nell’universo ridotto o condizionato dei campioni bernoulliani di ordine n regolato dalla seguente legge multinomiale tronca o condizionata di probabilità n k 1 n! n! ni n PrN 0i ni ; n, k , pi i p pi i (6) i n1 , n2 ,..., ni ,..., ni 1 ni ! i ni ! i i i in cui gli ni (i ) assumono i valori interi da 1 ad n – k +1 sotto il vincolo ni = n. i Il motivo per cui nella (6) sono escluse le determinazioni ni = 0 ed ni = n – k + 2, n – k + 3, …, n i sta nel fatto che per ni = 0 nella classe i-esima del campione (classificato) la media campionaria 1mi = 1si /ni (e più in generale il momento campionario rmi di ordine r ) non è definita. Infine 1i = E Ni = n pi e 10i = E N0i, dove Ni ed N0i sono le variabili casuali che si distribuiscono rispettivamente secondo la legge binomiale completa e tronca o condizionata di probabilità. Pertanto le statistiche di conformità (2)-(5) devono essere studiate nell’universo ridotto o condizionato dei campioni bernoulliani di ordine n, che è un sottoinsieme dell’universo completo dei campioni bernoulliani di ordine n e che da questo si ottiene togliendogli i campioni per i quali si riscontri almeno una classe con frequenza nulla. A scopo comparativo anche X 02 dovrà essere studiata nell’universo ridotto o condizionato pur essendo definita sin dall’origine nell’universo completo (cfr. Pearson 1900). In questa memoria presentiamo nelle sezioni 2 e 3 i risultati finali ai quali siamo giunti nella determinazione teorica dei valori medi e delle varianze delle vcc X 02 , X 02 , W 02 , 2 2 W 0 , V 0 nell’universo ridotto o condizionato dei campioni bernoulliani di n unità con k classi di modalità, rinviando il lettore ad altri lavori per le dimostrazioni di tali risultati. 2. I valori medi delle statistiche di conformità X 02 , X 02 , W 02 , W 02 , V 02 sotto l’ipotesi nulla Premettiamo per i dovuti confronti il valore medio della statistica X2 = (N ) i i 1 i 2 / 1 i di K. Pearson nell’universo completo Un dei campioni bernoulliani di ordine n (sotto l’ipotesi nulla). E’ noto che (cfr. Maldane 1937) E X 2 1 i1 2 i = k -1 (7) i i = E Ni = n pi i = Var Ni = n pi (1- pi). I valori medi delle statistiche X 02 , X 02 , W 02 , W 02 , V 02 nell’universo ridotto o condizionato U(n,k) dei campioni bernoulliani di n unità con k classi di modalità (sotto l’ipotesi nulla) sono i seguenti (cfr. Zanardi 1998, p. 100): dove: 1 e 2 E X 02 1 0i1 2 0i (8) i E X 02 = 1 0i i 1.1 0i , 0i = 1 0i (1 0i / .1 0i1 1 ) = 1 0i (1i 1 ) i E W02 k E W 02 k (10) (11) E V02 1 i .1 0i 1 i / .1 0i1 1 i i dove: i = E N0i , 2 0i = Var N0i .1 0i = E N 0i1 , 1.1 0i = (12) i 1 0 i 1i (9) i Cov( N 0i , N0i1 ); = 1 i .1 0i = 1 i /.1 0i1 essendo 1i il rapporto tra la media aritmetica della vc Ni e la media armonica della vc N0i . 3. Le varianze delle statistiche di conformità X 02 , X 02 , W 02 , W 02 , V 02 sotto l’ipotesi nulla Abbiamo dimostrato che la varianza della statistica X 2 di K. Pearson nell’universo completo Un dei campioni bernoulliani di ordine n (sotto l’ipotesi nulla) può essere scritta come Var X 2 i 2 h 2, 2 i , h 1 1 h2 2 h 2 1 1 1 i 1 h 2 i h h 4 h 1 (13) dove: 2 2, 2 2, 2 4 i , h 2, 2 i , h 2 i 2 h , 4 h 4 h 2 h , i ,h E{N i 1 i 2 N h 1 h 2 }, i h h EN h 1 h 4 . La (13) dopo vari passaggi si riduce a (cfr. Maldane 1937) Var X 2 n 1 n 12k k 2 p h1 . h (14) Abbiamo dimostrato che le varianze delle statistiche di conformità X 02 , X 02 , W 02 , W 02 , 2 V 0 nell’universo ridotto o condizionato U(n,k) dei campioni bernoulliani di n unità con k classi di modalità (sotto l’ipotesi nulla) sono le seguenti: Var X 0 2 1 1 1 0i 1 0 h 2 0i 2 0 h 2, 2 0i ,0 h 1 1 0 h 2 0 h 4 0 h 1 h i h (15) 2 Var X 0 2 2 4 1 0i 1 0 h .1.1 0i , 0 h 1 0 h .2 0 h i h h (16) 2 2 2 Var W0 2k 2 .1.1 i h v 0i ,0 h [( 4 h 3) .3 v 0 h .1 0 h 3.2 v 0 h ] (17) h 2 Var W 0 2k ( 4 h 3) .1 0 h (18) h Var V0 2 1 2i 2 h 1 i h i 1 h .1.1v 0i ,0 h 1 2h [( 4 h 3).3 v 0h .1 0h 3.2v 0h ] (19) h dove: 2, 2 0i ,0h 2, 2 0i ,0h 2, 2 0i , 0 h 4 2 0i 2 0h 4 0 h 4 0 h , 2 2 0 h , E{N 0i 1 0i N 0h 1 0h } , i h , 2 2 0h EN 0h 1 0h 4 , .1.1 0i , 0 h E{N 0i1 .1 0i N 0h1 .1 0 h } , i h , .1.1v 0i ,0h .1.1 0i,0h .2 v 0 h e 4 h 4 h .2 0 h 2 .1 0 h .1 0i .1 0h , , .3v 0h .3 0h 3 .1 0h h è il coefficiente di Pearson della distribuzione parziale relativa alla 2 4 classe h-esima. Riferimenti bibliografici Dancelli L. (1993) Test di adattamento per distribuzioni di cui siano note frequenze e quantità, in: Statistica, A. LIII, n. 1, pp. 87-108. Maldane J.B.S. (1937) The Exact Value of the Moments of the Distribution of 2, used as a Test of Goodness of Fit, when Expectation are Small, in: Biometrika, vol. 29, pp. 133-143. Pearson K. (1900) On the Criterion that a given System of Deviations from the Probable in the case of a correlated System of Variables is such that it can be reasonably supposed to have arisen from Random Sampling, in: Philosophy Magazine, vol. 50, pp. 157-172. Zanardi G. (1998) Studio campionario delle distribuzioni note le frequenze e le quantità delle classi, in: Atti della giornata di studio su Qualità dei dati, Campionamento, Inferenza, Venezia 26 settembre 1996, Collana ricerche, Dipartimento di Statistica Università Ca’ Foscari di Venezia, pp. 83 – 102. Zanardi G. (1999), Il calcolo dei valori medi delle statistiche di conformità X 02 , X 02 , 2 2 2 W 0 , W 0 , V 0 sotto l’ipotesi nulla, in: Serie rapporti di ricerca, n. 6, Dipartimento di Statistica Università Ca’ Foscari di Venezia, pp. 1 - 78.