Le curve normali di ordine p nell'ambito delle distribuzioni di errori accidentali: una rassegna dei risultati e problemi aperti per il caso univariato e per quello multivariato 1 The Normal Distributions of order p in the framework of Random Errors Distributions: a Review of present results and open Problems in the Univariate and Multivariate situation Marcello Chiodi Istituto di Statistica, Facoltà di Economia di Palermo Viale delle Scienze, 90128 - Palermo-Italy - e-mail: [email protected] Abstract: The normal distributions of order p (known also as exponential power distributions) are used in the description of non normal random errors in the general situation of Lp-norm regression. Properties of M.L. estimators and tests are reviewed; in the paper are also reported few results concerning some multivariate extensions. Parole chiave: Normal Distributions of order p, exponential power distributions, Lp-norm regression, Monte Carlo studies, multivariate non normal distributions. 1. Le distribuzioni normali di ordine p univariate e multivariate. Il modello delle curve normali di ordine p è costituito dalla famiglia di distribuzioni di variabile reale Z, di densità f(z)=[2pp1/p(1+1/p)]-1exp[-|z-|p/(pp;p)], p > 0, z. Tale famiglia di curve fu introdotta da Subbotin (1923) in modo abbastanza naturale come distribuzione di errori di osservazione di natura accidentale di misure dirette di una quantità incognita, facendo solo due ipotesi, più generali di quelle di Gauss: 1) la probabilità di un errore dipende soltanto dalla grandezza dell'errore stesso e può essere espressa da una funzione f( dotata di derivata prima continua in generale; 2) il valore più probabile di una quantità , della quale siano note delle misure dirette zi, non deve dipendere dall'unità di misura adottata (2° assioma di Schiaparelli); Questa famiglia di curve, ripresa poi da vari Autori, è citata spesso nella letteratura anglosassone come exponential power distribution, ma con diverse parametrizzazioni: p.e. quella di Box, Tiao (1973), per lo studio della robustezza dell'inferenza bayesiana, in cui p è legato ad un parametro di non-normalità dalla relazione: p=2/(1+). Nella forma da noi usata, E[Z] è il vero valore di una quantità, i cui valori osservati z sono affetti da errori con dispersione p=(E| Z - |p)1/p, scarto medio assoluto di ordine p. Le curve sono unimodali, simmetriche e, per p > 1, campanulari. Come casi particolari si hanno la distribuzione di Laplace (p = 1), la normale (p = 2) e l’uniforme (pIl parametro di forma p è collegato con la kurtosi, ed i valori dell'indice di 1 Questa ricerca é stata realizzata utilizzando fondi MURST (ex 60%) kurtosi 2 variano da 2 per p0+ a 1,8 per la distribuzione uniforme (p). Il modello é usato in problemi di regressione del tipo: Yi=g(xi,)+i; se le i sono indipendenti e distribuite secondo delle normali di ordine p, con E[i]=0 e p(i)=, le stime di massima verosimiglianza dei coefficienti se p é noto, si ottengono minimizzando i=1,n | yi - g(xi,)|p. Un problema fondamentale é comunque la stima del parametro di struttura p, che svolge in molti casi il ruolo di parametro di disturbo: una buona soluzione per piccoli campioni, nel caso in cui g(xi,)= é quella di A.M. Mineo (1994). Nel lavoro verrà presentata una rassegna dei principali risultati noti sulle distribuzioni campionarie di stimatori e test per i quali, se p è noto, esistono in alcuni casi risultati esatti (Lunetta 1966), o in casi più generali, approssimazioni asintotiche di varia natura, fra cui (Chiodi, 1994) quelle basate sulla determinazione dei punti di sella oltre quelli basati su tecniche di tipo Montecarlo. Per quanto riguarda le estensioni multivariate di tale famiglia, queste non possono essere ottenute in forma unica, come avviene invece per la normale multivariata: fra queste una particolare estensione di Taguchi, ma solo per il caso bivariato, con distribuzioni marginali normali di ordine p, è caratterizzata da un particolare indice di correlazione di norma p ma tuttavia con distribuzioni parziali asimmetriche risulta di scarsa rilevanza pratica. Altre generalizzazioni si trovano con opportune estensioni ad esempio del sistema multivariato di Johnson, oppure come caso particolare del sistema di curve simmetriche di Kotz, di densità: f(y)= C | |-1/2 exp{-r[(y-'-1(y-s}, che, quando s1, rappresenta degli allontanamenti, a contorni ellissoidali, dalla normale multivariata. In effetti si ritrovano impieghi di questa ed altre estensioni multivariate essenzialmente come distribuzioni alternative in test di multinormalità (p.e. Naito, 1998) o per valutare la robustezza di test multivariati rispetto ad allontanamenti dalla normalità. Meno utilizzate sono invece tali estensioni multivariate per la descrizione di insiemi di dati multivariati, o per la descrizione di errori accidentali di osservazioni di misurazioni multiple ripetute o come distribuzione di errori in modelli di regressione lineare e non lineare. Riferimenti bibliografici Box G.E.P., Tiao G.C. (1973) Bayesian inference in statistical analysis. AddisonWesley Ed.; Reading, Massachusetts. Chiodi M. (1994) Approssimazioni saddlepoint alle distribuzioni campionarie degli stimatori di massima verosimiglianza dei parametri delle curve normali di ordine p per piccoli campioni. Atti della XXXVII Riunione Scientifica SIS. Ed. C.I.S.U. Roma;1,139-146. Lunetta G. (1966) Di alcune distribuzioni deducibili da una generalizzazione dello schema della curva normale. Annali della Facoltà Economia e Commercio di Palermo,20,1, 117-143. Mineo A. M. (1994) Un nuovo metodo di stima di p per una corretta valutazione dei parametri di intensità e di scala di una curva normale di ordine p. Atti della XXXVII Riunione Scientifica della SIS. Ed. C.I.S.U. Roma; 1, 147-154. Naito K. (1998), Approximation of the power of kurtosis test for multinormality, Journal of multivariate analysis, 65, 166-180. Subbotin M. T.(1923) On the law of frequency of errors, Matem. Sbornik, 31, 296-301.