Le curve normali di ordine p nell`ambito delle - UniFI

Le curve normali di ordine p nell'ambito delle
distribuzioni di errori accidentali: una rassegna dei
risultati e problemi aperti per il caso univariato e per
quello multivariato
1
The Normal Distributions of order p in the framework of Random
Errors Distributions: a Review of present results and open Problems
in the Univariate and Multivariate situation
Marcello Chiodi
Istituto di Statistica, Facoltà di Economia di Palermo
Viale delle Scienze, 90128 - Palermo-Italy - e-mail: [email protected]
Abstract: The normal distributions of order p (known also as exponential power
distributions) are used in the description of non normal random errors in the general
situation of Lp-norm regression. Properties of M.L. estimators and tests are reviewed; in
the paper are also reported few results concerning some multivariate extensions.
Parole chiave: Normal Distributions of order p, exponential power distributions,
Lp-norm regression, Monte Carlo studies, multivariate non normal distributions.
1. Le distribuzioni normali di ordine p univariate e multivariate.
Il modello delle curve normali di ordine p è costituito dalla famiglia di distribuzioni
di variabile reale Z, di densità f(z)=[2pp1/p(1+1/p)]-1exp[-|z-|p/(pp;p)], p > 0, z.
Tale famiglia di curve fu introdotta da Subbotin (1923) in modo abbastanza naturale
come distribuzione di errori di osservazione di natura accidentale di misure dirette di
una quantità incognita, facendo solo due ipotesi, più generali di quelle di Gauss:
1) la probabilità di un errore dipende soltanto dalla grandezza dell'errore stesso e può
essere espressa da una funzione f( dotata di derivata prima continua in generale;
2) il valore più probabile di una quantità , della quale siano note delle misure dirette zi,
non deve dipendere dall'unità di misura adottata (2° assioma di Schiaparelli);
Questa famiglia di curve, ripresa poi da vari Autori, è citata spesso nella letteratura
anglosassone come exponential power distribution, ma con diverse parametrizzazioni:
p.e. quella di Box, Tiao (1973), per lo studio della robustezza dell'inferenza bayesiana,
in cui p è legato ad un parametro  di non-normalità dalla relazione: p=2/(1+).
Nella forma da noi usata, E[Z] è il vero valore di una quantità, i cui valori
osservati z sono affetti da errori con dispersione p=(E| Z - |p)1/p, scarto medio assoluto
di ordine p. Le curve sono unimodali, simmetriche e, per p > 1, campanulari. Come casi
particolari si hanno la distribuzione di Laplace (p = 1), la normale (p = 2) e l’uniforme
(pIl parametro di forma p è collegato con la kurtosi, ed i valori dell'indice di
1
Questa ricerca é stata realizzata utilizzando fondi MURST (ex 60%)
kurtosi 2 variano da 2  per p0+ a 1,8 per la distribuzione uniforme (p). Il
modello é usato in problemi di regressione del tipo: Yi=g(xi,)+i; se le i sono
indipendenti e distribuite secondo delle normali di ordine p, con E[i]=0 e p(i)=, le
stime di massima verosimiglianza dei coefficienti  se p é noto, si ottengono
minimizzando i=1,n | yi - g(xi,)|p. Un problema fondamentale é comunque la stima del
parametro di struttura p, che svolge in molti casi il ruolo di parametro di disturbo: una
buona soluzione per piccoli campioni, nel caso in cui g(xi,)= é quella di A.M. Mineo
(1994). Nel lavoro verrà presentata una rassegna dei principali risultati noti sulle
distribuzioni campionarie di stimatori e test per i quali, se p è noto, esistono in alcuni
casi risultati esatti (Lunetta 1966), o in casi più generali, approssimazioni asintotiche di
varia natura, fra cui (Chiodi, 1994) quelle basate sulla determinazione dei punti di sella
oltre quelli basati su tecniche di tipo Montecarlo.
Per quanto riguarda le estensioni multivariate di tale famiglia, queste non possono
essere ottenute in forma unica, come avviene invece per la normale multivariata: fra
queste una particolare estensione di Taguchi, ma solo per il caso bivariato, con
distribuzioni marginali normali di ordine p, è caratterizzata da un particolare indice di
correlazione di norma p ma tuttavia con distribuzioni parziali asimmetriche risulta di
scarsa rilevanza pratica. Altre generalizzazioni si trovano con opportune estensioni ad
esempio del sistema multivariato di Johnson, oppure come caso particolare del sistema
di curve simmetriche di Kotz, di densità: f(y)= C | |-1/2 exp{-r[(y-'-1(y-s}, che,
quando s1, rappresenta degli allontanamenti, a contorni ellissoidali, dalla normale
multivariata. In effetti si ritrovano impieghi di questa ed altre estensioni multivariate
essenzialmente come distribuzioni alternative in test di multinormalità (p.e. Naito,
1998) o per valutare la robustezza di test multivariati rispetto ad allontanamenti dalla
normalità. Meno utilizzate sono invece tali estensioni multivariate per la descrizione di
insiemi di dati multivariati, o per la descrizione di errori accidentali di osservazioni di
misurazioni multiple ripetute o come distribuzione di errori in modelli di regressione
lineare e non lineare.
Riferimenti bibliografici
Box G.E.P., Tiao G.C. (1973) Bayesian inference in statistical analysis. AddisonWesley Ed.; Reading, Massachusetts.
Chiodi M. (1994) Approssimazioni saddlepoint alle distribuzioni campionarie degli
stimatori di massima verosimiglianza dei parametri delle curve normali di ordine p
per piccoli campioni. Atti della XXXVII Riunione Scientifica SIS. Ed. C.I.S.U.
Roma;1,139-146.
Lunetta G. (1966) Di alcune distribuzioni deducibili da una generalizzazione dello
schema della curva normale. Annali della Facoltà Economia e Commercio di
Palermo,20,1, 117-143.
Mineo A. M. (1994) Un nuovo metodo di stima di p per una corretta valutazione dei
parametri di intensità e di scala di una curva normale di ordine p. Atti della XXXVII
Riunione Scientifica della SIS. Ed. C.I.S.U. Roma; 1, 147-154.
Naito K. (1998), Approximation of the power of kurtosis test for multinormality,
Journal of multivariate analysis, 65, 166-180.
Subbotin M. T.(1923) On the law of frequency of errors, Matem. Sbornik, 31, 296-301.