ALTRE MEDIE ANALITICHE
Media troncata (trimmed mean)
Uno dei limiti della media aritmetica è di essere sensibile a dati particolarmente scostati rispetto
all’insieme degli altri. Il problema è superabile utilizzando indici di posizione, oppure facendo
riferimento a questa particolare media aritmetica calcolata dopo aver eliminato i valori più
estremi della casistica in esame. La quantità di dati da scartare viene decisa in percentuale (5,
10, 20% ecc.) in relazione alla quantità di valori che potrebbero compromettere il significato della
media e deve riguardare simmetricamente i valori più alti e quelli più bassi.
Media mobile
Quando un fenomeno viene seguito nel tempo, un modo di presentarlo è costruire una serie
temporale considerando i valori riscontrati in singoli periodi di osservazione (giorni, mesi, anni
ecc.); in questo modo si è in grado di evidenziare variazioni caratteristiche. Se i valori sono
soggetti a fluttuazioni, questa variabilità unita a quella casuale potrebbe mascherare qualche
particolare andamento generale (trend).
Un metodo semplice per ridurre le variabilità che possono mascherare il trend di una serie
temporale consiste nell’uso della media mobile.
Si tratta di calcolare una serie di nuovi valori ottenuti
ciascuno come media aritmetica di N dati originali
consecutivi (in genere 3), a partire dal primo e scalando di
una osservazione di volta in volta: il primo si ottiene come
media delle prime tre osservazioni, il secondo deriva dalla
seconda, terza e quarta osservazione e così a seguire. Si
ottiene una serie di valori medi nei quali è attenuata la
variabilità non dovuta all’andamento generale (Figura 1).
Non è ovviamente possibile attribuire valori di media mobile
al primo e all’ultimo dato originale
Elementi di Statistica medica
Pasquale Bruno Lantieri, Domenico Risso, Giambattista Ravera
Copyright © 2007 – The McGraw-Hill Companies s.r.l.
Media geometrica
In certe circostanze, la media aritmetica non rappresenta in modo adeguato la tendenza centrale
dei dati; per esempio, non è conveniente utilizzarla nel caso di dati distribuiti su diversi ordini di
grandezza. La media aritmetica di 10, 100 e 1000 è , troppo spostata verso il valore alto e quindi
poco plausibile per segnalare la centralità: si evidenzia così un limite di utilizzazione della media
aritmetica. Quando i dati appaiono legati tra loro da un fattore moltiplicativo (in linguaggio
matematico, si dovrebbe parlare di dati in successione geometrica), i valori elevati acquistano un
peso preponderante rispetto ai valori bassi e alzano drasticamente il valore della media
aritmetica.
All’inconveniente prospettato si ovvia utilizzando la media geometrica definita da:
N
MG  N x1  x2    xN  N  xi
i 1
cioè la radice ennesima del prodotto (o produttoria, in analogia alla sommatoria) delle N
osservazioni.
Nel caso di osservazioni ripetute, o di distribuzioni in classi, la formula viene adattata come
media geometrica ponderata:
MG  fi x1f1  x2f2    xNfN  fi
x
fi
i
Se ricalcoliamo la tendenza centrale di 10, 100 e 1000 come media geometrica, si ottiene
MG  3 10  102  103  3 106  102  100
che meglio rappresenta la centralità dei dati.
Elementi di Statistica medica
Pasquale Bruno Lantieri, Domenico Risso, Giambattista Ravera
Copyright © 2007 – The McGraw-Hill Companies s.r.l.
La media geometrica viene largamente usata nelle ricerche di microbiologia e sierologia che
prevedono titolazioni di soluzioni ottenute mediante diluizioni costanti. Di conseguenza, le
concentrazioni si riducono in base al fattore di diluizione determinando valori in successione
geometrica. Analogamente, la media geometrica viene preferita per serie temporali riferite allo
sviluppo di microrganismi e, per assimilazione, nel caso di variazioni di una popolazione in
accrescimento o in diminuzione, se espresse da una successione geometrica. Ci si ricollega
alle variazioni percentuali precedentemente viste.
Quando un fenomeno varia nel tempo sia in più sia in meno rispetto a un valore di riferimento
(e interessano non tanto le variazioni intese come differenze, quanto le variazioni relative), le
misure sono costituite da rapporti, di cui sono un esempio i già considerati numeri indice. In
questo caso, la media geometrica permette di attribuire uno stesso peso a variazioni relative
uguali per intensità, ma opposte per verso, diversamente da come si comporta la media
aritmetica che attribuisce peso maggiore agli aumenti piuttosto che alle diminuzioni. Dato un
valore di partenza pari a 10 con la possibilità di variazioni relative di ordine 2, il nuovo valore
diventerà rispettivamente 20 in accrescimento e 5 in diminuzione; la media aritmetica tra
questi due valori è 12.5 mentre la media geometrica risulta 10, che si pone effettivamente
come valore centrale tra i due. Le variazioni percentuali sono una particolare espressione di
variazioni relative e, in quanto tali, per ottenerne la tendenza centrale devono essere elaborate
come media geometrica delle variazioni relative.
È evidente che la media geometrica non ha significato in presenza di valori nulli o negativi e, di
conseguenza, è utilizzabile solo con scale quantitative di rapporto.
Elementi di Statistica medica
Pasquale Bruno Lantieri, Domenico Risso, Giambattista Ravera
Copyright © 2007 – The McGraw-Hill Companies s.r.l.
Elementi di Statistica medica
Pasquale Bruno Lantieri, Domenico Risso, Giambattista Ravera
Copyright © 2007 – The McGraw-Hill Companies s.r.l.
Media armonica
Una media analitica di uso meno frequente è la media armonica, definita come il reciproco
della media aritmetica del reciproco delle misure:
MA 
1
N

1
1


xi
xi
N
oppure, per dati ripetuti o distribuzioni in classi,
MA 
 fi
f
 i
xi
Tale media trova applicazione nella valutazione di tempi di reazione o risposta, in prove di
tossicità, sopravvivenza postoperatoria ecc. e, in genere, quando un fenomeno si dovrebbe
prevedibilmente esaurire in un arco di tempo definito. In tali situazioni, poiché la rilevazione
viene limitata a tale periodo, sorge il problema di come considerare, agli effetti di una
tendenza centrale, i tempi che vanno oltre il periodo ragionevole di controllo, per un tempo
quindi ipoteticamente “infinito”. La media armonica permette di tener conto nell’elaborazione
anche dei valori “infiniti” (il reciproco di  è 0) che, come tali, impedirebbero il calcolo di altre
medie analitiche (per contro, è evidente che la media armonica non è utilizzabile nel caso di
valori nulli). Per analogia, si possono considerare valori infiniti i dati di laboratorio
indeterminati del tipo > 100 mg dovuti a una limitata sensibilità dello strumento di misura.
Elementi di Statistica medica
Pasquale Bruno Lantieri, Domenico Risso, Giambattista Ravera
Copyright © 2007 – The McGraw-Hill Companies s.r.l.
La media armonica gode delle stesse proprietà della media aritmetica rispetto ai reciproci delle
misure. Di conseguenza, trova applicazione anche quando occorre calcolare la media di una
variabile rilevata come reciproco dell’informazione che interessa. Volendo stabilire il consumo
medio in un dato arco di tempo (giorno, settimana, mese ecc.) di un prodotto, per esempio un
farmaco di uso non continuativo, può essere più agevole raccogliere l’informazione riguardante
la durata di una confezione (la durata è il reciproco del consumo, oggetto di indagine). La
media armonica dei tempi di durata fornisce un’informazione utile per valutare la tendenza
centrale del consumo (che è il reciproco della media armonica ottenuta). Per contro, la
tendenza centrale ottenuta come reciproco della media aritmetica dei tempi di durata
porterebbe a risultati che non rispecchiano la realtà.
Relazioni tra medie analitiche
Tra le medie aritmetica, geometrica e armonica, calcolate su una stessa serie di misure, esiste
la relazione:
MA  MG  x
(principio di Cauchy)
dove il segno di uguaglianza vale solo nel caso in cui le osservazioni siano tutte uguali.
Elementi di Statistica medica
Pasquale Bruno Lantieri, Domenico Risso, Giambattista Ravera
Copyright © 2007 – The McGraw-Hill Companies s.r.l.