STATISTICA corso base Appunti integrativi 1 1 – Le medie Definizioni generali di media: A - “E’ media qualunque valore [quindi il riferimento è ai soli caratteri quantitativi] compreso tra il più piccolo ed il più grande dei valori osservati” (Cauchy). E’ il cd. principio di internalità, formalmente importante ma di nullo significato operativo ai fini della scelta della media preferibile nei diversi contesti operativi. Una sua esplicitazione formale si ha nella formula generale delle medie potenziate: Mk = (Σxik / n)1/k Per valori di X strettamente positivi è possibile calcolare medie potenziate di qualsiasi ordine k ≠ 0. In particolare: - per k = 1 si ottiene la media aritmetica, - per k = - 1 si ottiene la media armonica, - per k = 2 si ottiene la media quadratica. Per k = 0 si ha una forma indeterminata del tipo 1 ∞; si ricorre allora al calcolo del limite per k → 0 e si ottiene la media geometrica. Si dimostra che la Mk è una funzione monotona non decrescente di k (crescente se le xi non sono tutte uguali tra loro), che va da un minimo pari a x (1) (cioè il più piccolo tra i valori osservati) al tendere di k a - ∞ ad un massimo pari a x (n) (cioè il più grande tra i valori osservati.) al tendere di k a + ∞. Al variare di k, la M k assume tutti gli infiniti valori compresi tra x(1) e x(n). In presenza di valori di X non negativi è possibile calcolare soltanto medie di ordine k > 0. 1 Appunti a cura del prof. Francesco M. Sanna, ad esclusivo uso interno del corso. Vietata la riproduzione e la vendita. 1 In presenza di valori di X reali qualunque è possibile calcolare solo la M 1 (media aritmetica). B - “Dati n valori x1, x2, …, xn e definita una funzione f applicata a tali dati, è media quel valore m [quindi anche qui il riferimento è ai soli caratteri quantitativi], se esiste, che soddisfa il principio di internalità e verifica l’uguaglianza f(x1, x2, …, xn) = f(m, m, …, m) ” (Chisini). L’attenzione si sposta perciò dalla media alla funzione rispetto alla quale la media deve realizzare una condizione di invarianza; questa definizione rappresenta il più utile criterio operativo di scelta, allorché questa sia circoscritta alle sole medie analitiche. Le esplicitazioni più frequenti della f(x1, x2, …, xn) sono: - la somma dei dati: Σxi = n m (e si ottiene la media aritmetica) - il prodotto dei dati Πxi = mn (e si ottiene la media geometrica). C - Premesso che date n rilevazioni x 1, x2, …, xn non tutte uguali tra loro qualsiasi loro sintesi mediante un unico valore medio m comporterà una perdita di informazione – o errore di sostituzione -, “definita con g(xi, m) la misura del danno conseguente alla sostituzione della ima osservazione con la costante m e definita la funzione f aggregatrice dei danni singoli (funzione di perdita, o di danno), sarà media quel valore m [ma, con opportune cautele, potrebbe trattarsi di modalità qualitative e perciò tale definizione può essere estesa alla sintesi dei caratteri qualitativi; m sarà allora una modalità tra quelle osservate] che minimizza la funzione di perdita” (Wald). E’ una definizione che si ispira ad un concetto utilitaristico facilmente comprensibile e ha il vantaggio di fornire simultaneamente indicazioni circa l’indice di dimensione (minimante) e l’indice di dispersione (minimo) preferibili. Collega anche dal punto di vista formale due aspetti fondamentali della Statistica: media e variabilità. L’esplicitazione della funzione g(xi, m) deve soddisfare i seguenti requisiti: 2 - g(xi, m) = 0 se e solo se xi = m - g(xi, m) > 0 se xi ≠ m - al crescere della dimensione dell’errore di sostituzione, esprimibile mediante la distanza |xi – m|, il valore di g(xi, m) deve crescere o, al più, mantenersi costante, mai diminuire. La funzione aggregatrice f è usualmente la somma dei danni singoli, ma può essere qualunque funzione che risulti positiva se e solo se almeno una delle |x i – m|, è diversa da zero e nulla se e solo se tutte le osservazioni sono uguali tra loro (ed uguali alla media). La media m è perciò quel valore che, minimizzando il danno globale, fa pagare il minor prezzo in termini di perdita informativa D – Le medie possono essere individuate anche come “centri” [sempre con riferimento a dati quantitativ], a partire dall’espressione: Σ |xi – M|r = min ricercando il valore di M che soddisfa la condizione posta, al variare di r. In particolare: - per r = 0 si ottiene M = Md, cioè la moda, - per r = 1 si ottiene M = Me, cioè la mediana, - per r = 2 si ottiene M = M1, cioè la media aritmetica. Trasformate lineari Data la variabile X, si consideri una sua trasformata lineare Y = aX + b. In caso di trasformazione lineare completa si hanno sia la traslazione (cambiamento di origine, b ≠0), sia il cambiamento di unità di misura ( | a | ≠ 1) sia, eventualmente, il cambiamento di verso ( a < 0 ). 3 La media aritmetica di una trasformata lineare è pari alla trasformata lineare della media aritmetica, ovvero: My = a Mx + b, facilmente dimostrabile sostituendo a ciascuna yi la sua espressione yi = a xi + b. Nel caso della media geometrica, una proprietà analoga vale soltanto se si è in presenza solo di un cambiamento di unità di misura, cioè per trasformate lineari incomplete del tipo Y = a X (a ≠ 1; a >0). Analoga proprietà vale invece, nel caso della media geometrica, per trasformate non lineari del tipo Y = a Xb. Nel caso della mediana, vale la stessa regola enunciata per la media aritmetica; nel caso del generico percentile di ordine p (0 < p < 1) la regola è la medesima, con la sola avvertenza, nel caso – poco frequente – in cui si abbia a < 0, che, a causa del cambiamento di verso, la trasformata lineare del percentile di ordine p della variabile X genera il percentile di ordine (1-p) della variabile Y, ovvero: y(1-p) = a xp + b. Per approfondimenti si veda: Naddeo, A. – Statistica di base, ed. Kappa, Roma, 1986, cap. III. 4