STATISTICA corso base
Appunti integrativi 1
1 – Le medie
Definizioni generali di media:
A - “E’ media qualunque valore [quindi il riferimento è ai soli caratteri quantitativi]
compreso tra il più piccolo ed il più grande dei valori osservati” (Cauchy). E’ il cd.
principio di internalità, formalmente importante ma di nullo significato operativo ai
fini della scelta della media preferibile nei diversi contesti operativi.
Una sua esplicitazione formale si ha nella formula generale delle medie potenziate:
Mk = (Σxik / n)1/k
Per valori di X strettamente positivi è possibile calcolare medie potenziate di
qualsiasi ordine k ≠ 0. In particolare:
- per k = 1 si ottiene la media aritmetica,
-
per k = - 1 si ottiene la media armonica,
-
per k = 2 si ottiene la media quadratica.
Per k = 0 si ha una forma indeterminata del tipo 1 ∞; si ricorre allora al calcolo del
limite per k → 0 e si ottiene la media geometrica.
Si dimostra che la Mk è una funzione monotona non decrescente di k (crescente se le
xi non sono tutte uguali tra loro), che va da un minimo pari a x (1) (cioè il più piccolo
tra i valori osservati) al tendere di k a - ∞ ad un massimo pari a x (n) (cioè il più grande
tra i valori osservati.) al tendere di k a + ∞. Al variare di k, la M k assume tutti gli
infiniti valori compresi tra x(1) e x(n).
In presenza di valori di X non negativi è possibile calcolare soltanto medie di ordine
k > 0.
1
Appunti a cura del prof. Francesco M. Sanna, ad esclusivo uso interno del corso. Vietata la riproduzione e la vendita.
1
In presenza di valori di X reali qualunque è possibile calcolare solo la M 1 (media
aritmetica).
B - “Dati n valori x1, x2, …, xn e definita una funzione f applicata a tali dati, è media
quel valore m [quindi anche qui il riferimento è ai soli caratteri quantitativi], se
esiste, che soddisfa il principio di internalità e verifica l’uguaglianza
f(x1, x2, …, xn) = f(m, m, …, m) ”
(Chisini).
L’attenzione si sposta perciò dalla media alla funzione rispetto alla quale la media
deve realizzare una condizione di invarianza; questa definizione rappresenta il più
utile criterio operativo di scelta, allorché questa sia circoscritta alle sole medie
analitiche.
Le esplicitazioni più frequenti della f(x1, x2, …, xn) sono:
-
la somma dei dati:
Σxi = n m (e si ottiene la media aritmetica)
-
il prodotto dei dati
Πxi = mn
(e si ottiene la media geometrica).
C - Premesso che date n rilevazioni x 1, x2, …, xn non tutte uguali tra loro qualsiasi
loro sintesi mediante un unico valore medio m comporterà una perdita di
informazione – o errore di sostituzione -, “definita con g(xi, m) la misura del danno
conseguente alla sostituzione della ima osservazione con la costante m e definita la
funzione f aggregatrice dei danni singoli (funzione di perdita, o di danno), sarà media
quel valore m [ma, con opportune cautele, potrebbe trattarsi di modalità qualitative e
perciò tale definizione può essere estesa alla sintesi dei caratteri qualitativi; m sarà
allora una modalità tra quelle osservate] che minimizza la funzione di perdita”
(Wald).
E’ una definizione che si ispira ad un concetto utilitaristico facilmente comprensibile
e ha il vantaggio di fornire simultaneamente indicazioni circa l’indice di dimensione
(minimante) e l’indice di dispersione (minimo) preferibili. Collega anche dal punto di
vista formale due aspetti fondamentali della Statistica: media e variabilità.
L’esplicitazione della funzione g(xi, m) deve soddisfare i seguenti requisiti:
2
- g(xi, m) = 0 se e solo se xi = m
- g(xi, m) > 0 se xi ≠ m
- al crescere della dimensione dell’errore di sostituzione, esprimibile mediante la
distanza |xi – m|, il valore di g(xi, m) deve crescere o, al più, mantenersi costante, mai
diminuire.
La funzione aggregatrice f è usualmente la somma dei danni singoli, ma può essere
qualunque funzione che risulti positiva se e solo se almeno una delle |x i – m|, è
diversa da zero e nulla se e solo se tutte le osservazioni sono uguali tra loro (ed uguali
alla media).
La media m è perciò quel valore che, minimizzando il danno globale, fa pagare il
minor prezzo in termini di perdita informativa
D – Le medie possono essere individuate anche come “centri” [sempre con
riferimento a dati quantitativ], a partire dall’espressione:
Σ |xi – M|r = min
ricercando il valore di M che soddisfa la condizione posta, al variare di r. In
particolare:
-
per r = 0 si ottiene M = Md, cioè la moda,
-
per r = 1 si ottiene M = Me, cioè la mediana,
-
per r = 2 si ottiene M = M1, cioè la media aritmetica.
Trasformate lineari
Data la variabile X, si consideri una sua trasformata lineare Y = aX + b.
In caso di trasformazione lineare completa si hanno sia la traslazione (cambiamento
di origine, b ≠0), sia il cambiamento di unità di misura ( | a | ≠ 1) sia, eventualmente,
il cambiamento di verso ( a < 0 ).
3
La media aritmetica di una trasformata lineare è pari alla trasformata lineare della
media aritmetica, ovvero: My = a Mx + b, facilmente dimostrabile sostituendo a
ciascuna yi la sua espressione yi = a xi + b.
Nel caso della media geometrica, una proprietà analoga vale soltanto se si è in
presenza solo di un cambiamento di unità di misura, cioè per trasformate lineari
incomplete del tipo Y = a X (a ≠ 1; a >0). Analoga proprietà vale invece, nel caso
della media geometrica, per trasformate non lineari del tipo Y = a Xb.
Nel caso della mediana, vale la stessa regola enunciata per la media aritmetica; nel
caso del generico percentile di ordine p (0 < p < 1) la regola è la medesima, con la
sola avvertenza, nel caso – poco frequente – in cui si abbia a < 0, che, a causa del
cambiamento di verso, la trasformata lineare del percentile di ordine p della variabile
X genera il percentile di ordine (1-p) della variabile Y, ovvero: y(1-p) = a xp + b.
Per approfondimenti si veda: Naddeo, A. – Statistica di base, ed. Kappa, Roma, 1986,
cap. III.
4