il calcolo dei valori medi delle statistiche di conformita

Le statistiche di conformità X 02 , X 02 , W 02 , W 02 , V 02
nell’universo ridotto o condizionato dei campioni
bernoulliani di ordine n (1)
Conformity Statistics X 02 , X 02 , W 02 , W 02 , V 02 in the reduced or
conditional Universes of Bernoulli Samples of the Order n
Giampaolo Zanardi
Università Ca’ Foscari di Venezia - Dipartimento di Statistica
San Polo 2347, 30125 Venezia – e-mail: [email protected]
Abstract: In a recent paper we drew a work scheme to study, under the null hypotesis,
in the reduced or conditional universe of Bernoulli samples of the order n, five
conformity statistics, two of which based on the distribution of frequencies and three on
the distribution of frequencies and quantities for the k modality classes. In this paper we
present the final results we have attained in the theoretical determination of the mean
values and the variances of said statistics under the null hipothesis subject to
verification.
Keywords: Statistical distributions, Frequencies, Quantities, Sampling, Mean sample
random variables, Tests of fit.
1. Le statistiche di conformità X 02 , X 02 , W 02 , W 02 , V 02 nell’universo
ridotto o condizionato dei campioni bernoulliani di ordine n
In un recente articolo (v. Zanardi 1998) abbiamo tracciato uno schema di lavoro
per studiare, sotto l’ipotesi nulla, nell’universo ridotto o condizionato dei campioni
bernoulliani di ordine n, le statistiche di conformità (2):
X 02   X 02i   ( N 0i 1 0i ) 2 /1 0i
(1)
X 02   X 02i   ( N 0i 1  0i ) 2 / N 0i
(2)
W02  W02i   (1 M i 1 i ) 2 / Var1M i
(3)
W02  W02i   (1M i 1i ) 2 /( i2 / N 0i )
(4)
V0  V02i   (1M i 1i ) 2 /( i2 /1 i )
(5)
i
i
i
i
i
i
i
i
i
i
(1) Lavoro prodotto nell’ambito del programma di ricerca di rilevante interesse nazionale “Metodologie e
modelli per l’inferenza induttiva e decisionale” cofinanziato dal Murst (1997).
(2) La simbologia utilizzata in questa memoria è quella introdotta nel nostro articolo del 1998 al quale
rinviamo per ogni chiarimento.
in cui 1i e 2i sono la media e la varianza della distribuzione parziale della classe iesima [i   ={1,2,…, k}] della popolazione, 1Mi è lo stimatore di 1i ossia la vcc
descritta dalla media aritmetica della classe i del campione (classificato) nell’universo
ridotto o condizionato dei campioni bernoulliani di ordine n regolato dalla seguente
legge multinomiale tronca o condizionata di probabilità
n  k 1
n!
n!
ni
n
PrN 0i  ni ; n, k , pi i   
p
pi i
(6)



i
n1 , n2 ,..., ni ,..., ni 1  ni ! i
 ni ! i
i
i
in cui gli ni (i  ) assumono i valori interi da 1 ad n – k +1 sotto il vincolo
 ni = n.
i
Il motivo per cui nella (6) sono escluse le determinazioni ni = 0 ed ni = n – k + 2, n – k
+ 3, …, n i   sta nel fatto che per ni = 0 nella classe i-esima del campione
(classificato) la media campionaria 1mi = 1si /ni (e più in generale il momento
campionario rmi di ordine r ) non è definita.
Infine 1i = E Ni = n pi e 10i = E N0i, dove Ni ed N0i sono le variabili casuali che si
distribuiscono rispettivamente secondo la legge binomiale completa e tronca o
condizionata di probabilità.
Pertanto le statistiche di conformità (2)-(5) devono essere studiate nell’universo ridotto
o condizionato dei campioni bernoulliani di ordine n, che è un sottoinsieme
dell’universo completo dei campioni bernoulliani di ordine n e che da questo si ottiene
togliendogli i campioni per i quali si riscontri almeno una classe con frequenza nulla.
A scopo comparativo anche X 02 dovrà essere studiata nell’universo ridotto o condizionato pur essendo definita sin dall’origine nell’universo completo (cfr. Pearson 1900).
In questa memoria presentiamo nelle sezioni 2 e 3 i risultati finali ai quali siamo giunti
nella determinazione teorica dei valori medi e delle varianze delle vcc X 02 , X 02 , W 02 ,
2
2
W 0 , V 0 nell’universo ridotto o condizionato dei campioni bernoulliani di n unità con k
classi di modalità, rinviando il lettore ad altri lavori per le dimostrazioni di tali risultati.
2. I valori medi delle statistiche di conformità X 02 , X 02 , W 02 , W 02 , V 02 sotto
l’ipotesi nulla
Premettiamo per i dovuti confronti il valore medio della statistica X2 =
(N   )
i
i
1
i
2
/ 1 i
di K. Pearson nell’universo completo Un dei campioni bernoulliani di ordine n (sotto
l’ipotesi nulla). E’ noto che (cfr. Maldane 1937)
E X 2   1 i1 2 i = k -1
(7)
i
 i = E Ni = n pi
 i = Var Ni = n pi (1- pi).
I valori medi delle statistiche X 02 , X 02 , W 02 , W 02 , V 02 nell’universo ridotto o
condizionato U(n,k) dei campioni bernoulliani di n unità con k classi di modalità (sotto
l’ipotesi nulla) sono i seguenti (cfr. Zanardi 1998, p. 100):
dove:
1
e
2
E X 02   1 0i1 2 0i
(8)
i
E X 02 =   1 0i
i
1.1 0i , 0i
=  1 0i (1  0i / .1 0i1  1 ) =  1 0i (1i  1 )
i
E W02  k
E W 02  k
(10)
(11)
E V02  1 i .1 0i   1 i / .1  0i1   1 i
i
dove:
i
= E N0i , 2 0i = Var N0i
.1 0i
= E N 0i1 ,
1.1 0i =
(12)
i
1 0 i
1i
(9)
i
Cov( N 0i , N0i1 );
= 1 i .1 0i = 1 i /.1 0i1
essendo 1i il rapporto tra la media aritmetica della vc Ni e la media armonica della vc
N0i .
3. Le varianze delle statistiche di conformità X 02 , X 02 , W 02 , W 02 , V 02 sotto
l’ipotesi nulla
Abbiamo dimostrato che la varianza della statistica X 2 di K. Pearson nell’universo
completo Un dei campioni bernoulliani di ordine n (sotto l’ipotesi nulla) può essere
scritta come
Var X 2 


 i 2 h  2, 2 i , h  1   1 h2 2 h
2
1
1
1 i 1 h 2
i  h
h
 4 h  1
(13)
dove:
2
2, 2
2, 2
4
i , h 2, 2 i , h 2 i 2 h , 4 h 4 h 2 h ,
 i ,h  E{N i 1  i 2 N h 1  h 2 }, i  h  
 h  EN h 1  h 4 .
La (13) dopo vari passaggi si riduce a (cfr. Maldane 1937)


Var X 2  n 1 n  12k  k 2   p h1  .
h


(14)
Abbiamo dimostrato che le varianze delle statistiche di conformità X 02 , X 02 , W 02 , W 02 ,
2
V 0 nell’universo ridotto o condizionato U(n,k) dei campioni bernoulliani di n unità con k
classi di modalità (sotto l’ipotesi nulla) sono le seguenti:
Var X 0 
2
1 1

1 0i 1 0 h 2 0i 2 0 h  2, 2 0i ,0 h  1   1 0 h 2 0 h  4 0 h  1
h
i  h
(15)
2
Var X 0 
2
2
4

1 0i 1 0 h .1.1 0i , 0 h   1 0 h .2 0 h
i  h
h
(16)
2
2
2
Var W0  2k 
2

.1.1
i h
v 0i ,0 h   [( 4  h  3) .3 v 0 h .1  0 h 3.2 v 0 h ]
(17)
h
2
Var W 0  2k   ( 4  h  3) .1  0 h
(18)
h
Var V0  2 1 2i 
2
h

1
i  h
i 1 h .1.1v 0i ,0 h 
  1 2h [( 4 h  3).3 v 0h .1 0h 3.2v 0h ]
(19)
h
dove:
2, 2 0i ,0h 2, 2 0i ,0h
2, 2 0i , 0 h
4
2 0i 2 0h
4 0 h  4 0 h
,
2
2 0 h
,
 E{N 0i 1  0i  N 0h 1  0h  } , i  h   ,
2
2
 0h  EN 0h 1  0h 4 ,
.1.1 0i , 0 h
 E{N 0i1  .1  0i  N 0h1  .1  0 h } , i  h  ,
.1.1v 0i ,0h
 .1.1 0i,0h
.2 v 0 h
e 4 h  4  h
 .2 0 h
2
.1 0 h
.1 0i .1 0h
,
,
.3v 0h
 .3 0h
3
.1 0h
 h è il coefficiente di Pearson della distribuzione parziale relativa alla
2
4
classe h-esima.
Riferimenti bibliografici
Dancelli L. (1993) Test di adattamento per distribuzioni di cui siano note frequenze e
quantità, in: Statistica, A. LIII, n. 1, pp. 87-108.
Maldane J.B.S. (1937) The Exact Value of the Moments of the Distribution of 2, used
as a Test of Goodness of Fit, when Expectation are Small, in: Biometrika, vol. 29, pp.
133-143.
Pearson K. (1900) On the Criterion that a given System of Deviations from the Probable
in the case of a correlated System of Variables is such that it can be reasonably
supposed to have arisen from Random Sampling, in: Philosophy Magazine, vol. 50,
pp. 157-172.
Zanardi G. (1998) Studio campionario delle distribuzioni note le frequenze e le quantità
delle classi, in: Atti della giornata di studio su Qualità dei dati, Campionamento,
Inferenza, Venezia 26 settembre 1996, Collana ricerche, Dipartimento di Statistica
Università Ca’ Foscari di Venezia, pp. 83 – 102.
Zanardi G. (1999), Il calcolo dei valori medi delle statistiche di conformità X 02 , X 02 ,
2
2
2
W 0 , W 0 , V 0 sotto l’ipotesi nulla, in: Serie rapporti di ricerca, n. 6, Dipartimento di
Statistica Università Ca’ Foscari di Venezia, pp. 1 - 78.