Indici STATISTICI - Progetto e

Indici STATISTICI
Nella ricerca scientifica e tecnologica, così come nelle scienze economiche, sociali e politiche, è
importante misurare la reale efficacia di interventi sul sistema oggetto di studio. Ciò significa
valutare gli effetti complessivi indotti da una causa nota, pur nella mutevolezza ed instabilità dei
risultati individuali. A tal riguardo, la Statistica ha proposto numerosi indici statistici, aventi quale
obiettivo proprio la misurazione di due componenti del fenomeno oggetto di studio e di interesse
scientifico: la consistenza della sistematicità, cioè la centralità, ovvero l’attitudine che hanno i
fenomeni ad assumere tendenzialmente una certa dimensione all’osservazione, e la variabilità o
mutabilità, cioè la dispersione, ovvero l’attitudine che hanno i fenomeni ad assumere dimensioni e
tendenze diverse all’osservazione, nel tempo e nello spazio.
La consistenza della sistematicità, ovvero la centralità, è misurata dai cosiddetti indici di
posizione (o indici di tendenza centrale o indicatori di posizione o misure di tendenza centrale), o
medie statistiche o ancora più semplicemente medie, in grado di esprimere e sintetizzare la
posizione di una distribuzione di frequenza mediante un valore reale rappresentativo della globalità
del fenomeno, riassumendone gli aspetti ritenuti più importanti. Tali indici si possono ricavare
effettuando operazioni che coinvolgono:
-
tutti i termini della serie (in tal caso gli indici di posizione maggiormente usati, denominati
medie analitiche o di calcolo, sono la media aritmetica, la media geometrica, la media
armonica e la media quadratica);
-
solo alcuni termini della serie, che si differenziano dagli altri per particolari caratteristiche
(in tal caso gli indici di posizione maggiormente usati, denominati medie posizionali o di
posizione, sono la mediana, la moda, i quantili).
Nonostante il concetto di media sia primitivo e percepito con immediatezza da ogni persona, la
sua misura risulta arbitraria, dal momento che il criterio di sintesi che si utilizza dipende
strettamente dalle informazioni ritenute più rilevanti e, quindi, dagli obiettivi per i quali la stessa
media viene calcolata. Sono state introdotte, pertanto, numerose definizioni di media delle quali,
però, verranno di seguito riportate solo le più significative:

una media secondo Cauchy di una variabile X è un qualunque valore reale M intermedio tra
il minimo min(x) ed il massimo max(x) di una distribuzione di frequenza, cioè tale che:
min(x) ≤ M ≤ max(x)
requisito questo che prende il nome di criterio di internalità;

una media secondo Chisini di una variabile X è un qualunque valore reale M intermedio, tra
il minimo min(x) ed il massimo max(x), il quale, rispetto ad una funzione sintetica delle
osservazioni, ne lascia inalterato il valore, cioè tale che:
f(x1, x2, …, xn) = f(M, M, …, M)
Il senso di tale definizione deriva dal tentativo di trovare un unico valore M che, sostituito a
ciascuna modalità di un’unità statistica, non cambia la predetta funzione. Affinché, però, tale
requisito, detto criterio di rappresentatività, diventi operativo, occorre specificare f in funzione
della natura (additiva, moltiplicativa, inversa, …) della variabile e della sua trasferibilità: è da ciò,
infatti, che derivano le molteplici tipologie di medie delle quali verranno riportate, nel seguito, le
più utili e quelle maggiormente diffuse.
La media aritmetica, denominata semplicemente media ed indicata con Ma, usata per riassumere
con un solo numero un insieme di n dati relativi ad un fenomeno misurabile, ovvero in presenza di
variabili quantitative qualora la differenza tra un dato ed il precedente risulti costante, è ottenuta
dividendo la somma di tutti gli n valori per il numero n di osservazioni; in formule è data da:
Ma 
x  x  ...  xn
1 n
xi  1 2

n i 1
n
La media aritmetica di n numeri, dunque, è quel numero che, sostituito a ciascuno di essi, lascia
invariata la somma totale e non può essere maggiore del valore più grande né minore del valore più
piccolo. Essendo, inoltre, la media statistica per eccellenza, consente un’ottima correzione degli
errori accidentali commessi in una rilevazione statistica, risultando così utile, nonostante la sua
scarsissima resistenza ai valori eccezionali, in tutti i campi della scienza e della tecnica in cui
vengono effettuate misurazioni di qualunque genere.
La media aritmetica, dunque, rappresenta il baricentro dei dati e quindi propone un valore che equiripartisce il fenomeno tra le unità statistiche, pervenendo così a decisioni nelle quali contano, a
parità numerica, gli estremi molto più dei valori centrali: la media aritmetica, infatti, costituisce un
indice di equilibrio generale.
Esempio.
Dati i seguenti cinque numeri (n = 5):
x1 = 10; x2 = 13; x3 = 9; x4 = 7; x5 = 12
la loro media aritmetica sarà uguale a:
Ma 
1 5
1
1
51
xi  10  13  9  7  12  51   10,2

5 i 1
5
5
5
Si osservi che, sostituendo a ciascun xi (i = 1, …, 5) il valore della media Ma e sommando i risultati,
si ottiene:
10,2  10,2  10,2  10,2  10,2  5  M a  5 10,2  51
che è proprio la somma degli xi:
10 + 13 + 9 + 7 + 12 = 51
La media aritmetica ponderata P, usata soprattutto per evidenziare l’importanza, ovvero il peso,
dei diversi valori di un carattere quantitativo, è ottenuta dividendo la somma dei prodotti dei numeri
per i loro pesi non negativi, cioè per le frequenze dei singoli valori, per la somma dei pesi stessi; in
formule è data da:
P
n
1
n
p
i 1
x p
i 1
i
i

x1 p1  x2 p2  ...  xn pn
p1  p2  ...  pn
i
Si osservi, a tal riguardo, che nella definizione di media aritmetica le modalità, e quindi le unità
statistiche, concorrono “alla pari” nella determinazione della media: ciascuna modalità, infatti,
“conta” per 1/n nella somma dei prodotti che definisce la media Ma. Tuttavia, esistono numerose
situazioni reali nelle quali tale approccio non risulta corretto perché le unità statistiche possiedono
importanza, esperienza o credibilità differenti tra loro (ad esempio, dopo la riforma universitaria che
ha introdotto il sistema dei crediti per misurare l’impegno richiesto per ciascun insegnamento, è
giusto valutare la carriera universitaria compiuta da uno studente ponderando i singoli voti con i
crediti acquisiti nel corrispondente esame; in tal modo si fornisce maggiore rilevanza ai risultati
conseguiti nelle materie che hanno richiesto un maggiore impegno di tempo). Per ogni tipo di
media, dunque, sarà possibile ponderare i dati, assegnando a ciascuno di essi un peso diverso:
anche se per semplificare il discorso, infatti, è sembrato opportuno soffermarsi solo sulla media
aritmetica ponderata, non si deve affatto pensare che questa sia il solo tipo di media ponderata
esistente.
Esempio.
Un’industria costruisce tre diversi tipi di copertoni per automobili: A, B, C. Il tempo necessario per
costruire i copertoni è riportato nella seguente tabella:
TIPO
TEMPO (minuti)
PEZZI PRODOTTI
A
45
400
B
15
2500
C
18
1500
Utilizzando solo la seconda colonna della tabella, risulta possibile calcolare il tempo medio
necessario per costruire un generico copertone:
Ma 
45  15  18 78

 26 minuti
3
3
Guardando anche la terza colonna della tabella, però, si può osservare che l’industria produce molti
copertoni di tipo B e pochi di tipo A, motivo per cui se si vuol calcolare un tempo medio di
produzione che tenga conto dei copertoni effettivamente prodotti, occorre ponderare i tre diversi
tempi con dei pesi corrispondenti al numero di pezzi prodotti. Il tempo medio di produzione
diventa, quindi:
P
45  400  15  2500  18 1500 18000  37500  27000 82500


 18,75 minuti
400  2500  1500
4400
4400
Ne segue, dunque, che la media ponderata rappresenta un valore più realistico rispetto a quella
aritmetica.
La media geometrica, usata quando le variabili quantitative risultano non lineari ma ottenute da
un prodotto o da un rapporto di valori lineari non negativi e diversi da zero, si ottiene estraendo la
radice n-esima del prodotto degli n termini; in formule è data da:
Mg  n
n
x
i
 n x1  x2  ...  xn
i 1
La media geometrica, considerata come quel valore che sostituito a ciascuno degli n dati ne lascia
inalterato il prodotto, è usata soprattutto quando i dati non sono numerosi, i termini della
distribuzione presentano valori molto differenti tra loro ed il rapporto tra un dato ed il precedente
risulta costante (ad esempio, la determinazione del tasso di interesse medio equivalente alla
sequenza dei tassi variabili, nel regime di capitalizzazione composta).
Esempio.
Dati i seguenti cinque numeri (n = 5):
x1 = 10; x2 = 13; x3 = 9; x4 = 7; x5 = 12
la loro media geometrica sarà uguale a:
5
M g   xi  5 10 13  9  7 12  5 98280  9,97
i 1
La media armonica, usata nello studio di variabili quantitative tra loro inversamente
proporzionali, ovvero quando si deve trovare il valore medio, non del fenomeno considerato, ma di
un fenomeno che è l’inverso del primo (ad esempio, prezzo di un bene e potere d’acquisto della
moneta, interesse effettivo che cresce al decrescere del costo del titolo, …), è pari al reciproco della
media aritmetica dei reciproci dei termini; in formule è data da:
Mh 
n
n
1
x
i 1
i

n
1 1
1
  ... 
x1 x2
xn
La media armonica, dunque, è quel valore tale che il suo reciproco, sostituito ai dati, che devono
essere tutti positivi, fa rimanere invariata la somma dei reciproci dei dati stessi: viene usata, infatti,
per mediare rapporti di tempo.
Esempio.
Dati i seguenti cinque numeri (n = 5):
x1 = 10; x2 = 13; x3 = 9; x4 = 7; x5 = 12
la loro media armonica sarà uguale a:
Mh 
5
5
1
x
i 1
i

5
5
5
16380


 5
 9,72
1 1 1 1 1 1638  1260  1820  2340  1365 8423
8423
   
10 13 9 7 12
16380
16380
La media quadratica si ottiene estraendo la radice quadrata della media aritmetica dei quadrati
degli n termini; in formule è data da:
1 n p p x1p  x2p  ...  xnp
M p x1 , x2 ,..., xn  
 xi 
n i 1
n
p
Tale media, denominata anche media di precisione, usata tutte le volte che alle differenze tra i
termini ed il valore medio si dà il significato di deviazione o errore del valore esatto, ovvero nei
casi in cui alcuni termini considerati risultano negativi e si desidera quindi eliminare la loro
influenza, trova applicazione soprattutto nell’ambito della teoria degli errori.
Esempio.
Dati i seguenti dieci numeri (n = 10):
x1 = 1; x2 = 1; x3 = 2; x4 = 2; x5 = 3; x6 = 3; x7 = 4; x8 = 4; x9 = 5; x10 = 5
la loro media quadratica sarà uguale a:
M 2 x1 , x2 ,..., x10  



1 10 2
1 2 2
xi 
1  1  22  22  32  32  42  42  52  52 

10 i 1
10
1
1  1  4  4  9  9  16  16  25  25  1 1  1  4  4  9  9  16  16  25  25 
10
10

110
 11  3,31
10
Tra le varie medie sopra descritte, dunque, sussiste la seguente relazione:
Mh  M g  Ma  M p
La mediana è quell’indice di posizione che, una volta ordinate in senso crescente le osservazioni
di un fenomeno, divide la distribuzione in due gruppi di uguale numerosità: al primo gruppo, infatti,
appartengono le osservazioni uguali o inferiori alla mediana; al secondo gruppo, invece, quelle
superiori o uguali alla mediana. La mediana, dunque, è la modalità dell’unità statistica che occupa il
posto centrale nella distribuzione ordinata delle osservazioni. Dato cioè un insieme costituito da n
intensità, x1, x2, …, xn, la determinazione della mediana è diversa a seconda che n sia pari o dispari,
precisamente:
-
se n è pari, la mediana è data dalla semisomma delle intensità individuate dai seguenti due
posti centrali, cioè dalla media aritmetica dei due valori centrali, ovvero:
C1  x n , C2  x n
2
-
2
1
 Me 
C1  C2
2
se n è dispari, la mediana è data dall’intensità individuata dal posto centrale nella
distribuzione, ovvero:
M e  x n 1
2
La mediana, pertanto, si può calcolare per tutte quelle variabili le cui modalità possono essere
ordinate, ovvero per le variabili qualitative ordinali, e per tutte le variabili quantitative: risulta,
infatti, più conveniente usarla qualora si voglia esprimere il valore centrale di distribuzioni di
caratteri che non possono essere misurati “esattamente” (ad esempio, i caratteri psicologici
graduabili) oppure qualora non si possa far riferimento alla distribuzione normale, proprio grazie
alla sua capacità di essere rappresentativa della posizione della distribuzione anche in presenza di
valori estremi notevolmente di versi da tutti gli altri.
La mediana, dunque, minimizza i costi complessivi ed è soprattutto resistente ai valori estremi:
rappresenta, infatti, un indice per decisioni che implicano costi elevati nei casi estremi.
Esempio.
Date le seguenti intensità (n = 7, numero dispari):
3; 15; 9; 2; 6; 12; 5
la loro mediana si ottiene ordinando dapprima le intensità in ordine crescente, ovvero:
x1 = 2; x2 = 3; x3 = 5; x4 = 6; x5 = 9; x6 = 12; x7 = 15
e poi considerando l’intensità che occupa il posto centrale, cioè Me = x4 = 6. Del resto, dalla
formula:
M e  x n1  x71  x8  x4  6
2
2
2
si può concludere analogamente che la mediana è data proprio dall’intensità che occupa il quarto
posto, ovvero Me = x4 = 6.
Esempio.
Date le seguenti intensità (n = 8, numero pari):
7; 16; 2; 3; 9; 12; 15; 5
la loro mediana si ottiene ordinando dapprima le intensità in ordine crescente, ovvero:
x1 = 2; x2 = 3; x3 = 5; x4 = 7; x5 = 9; x6 = 12; x7 = 15; x8 = 16
e poi considerando la semisomma delle intensità che occupano i due posti centrali,
x4 = 7; x5 = 9
cioè:
Me 
7  9 16
 8
2
2
Del resto, dalle formule:
C1  x n  x8  x4  7, C2  x n  x8  x41  x5  9
2
2
2
1
2
1
si può concludere analogamente che la mediana è data proprio dalla semisomma delle intensità che
occupano il quarto (x4 = 7) ed il quinto posto (x5 = 9), ovvero:
Me 
7  9 16
 8
2
2
La moda o norma della distribuzione di frequenza X, indicata con il simbolo M0 e calcolabile
per caratteri sia quantitativi sia qualitativi, non risentendo dei valori estremi, rappresenta la
modalità, o classe di modalità, caratterizzata dalla massima frequenza (assoluta o relativa), ovvero il
valore numerico che, nella distribuzione di frequenza, è maggiormente presente rispetto agli altri. A
tal riguardo occorre evidenziare che la moda è una modalità, non una frequenza. Se si rappresenta,
pertanto, la distribuzione di frequenza in termini grafici, si può affermare che la moda corrisponde
al picco della distribuzione che, di conseguenza, risulterà zeromodale se non ammette alcun valore
modale ovvero nessun picco, unimodale se ne ammette uno solo (in tal caso la moda ha significato
di sintesi), bimodale se ne ammette due, trimodale se ne ammette tre, … Per poter determinare,
quindi, la classe modale risulta opportuno ricorrere all’istogramma, individuando l’intervallo di
altezza massima, ovvero il punto di massimo della curva; la classe con la maggiore densità media,
corrispondente proprio all’altezza dell’istogramma, sarà quella modale.
La moda, dunque, minimizza gli scontenti ed è utilizzata in tutte quelle situazioni ove il consenso ed
il numero delle singole unità ha significato per la decisione: la moda, infatti, è un indice utile per
individuare la modalità più rappresentativa.
Esempio.
Data la seguente successione di termini (n = 13):
x1 = 3; x2 = 5; x3 = 9; x4 = 3; x5 = 5; x6 = 7; x7 = 3; x8 = 2; x9 = 9; x10 = 3; x11 = 4; x12 = 3; x13 = 6
la loro moda è data dal termine che compare con maggiore frequenza, ovvero è M0 = 3 perché
compare 5 volte.
Esempio.
Data la variabile X = numero di esami sostenuti da sei studenti ed osservati i seguenti valori:
STUDENTI
Nicola
Mary
Eleonora
Beatrice
Davide
Christian
ESAMI
30
19
8
7
27
10
si può concludere che la variabile X non ha moda, ovvero è zero modale, essendo la moda definita
come la modalità più frequente: non esiste, infatti, nessuna modalità (numero di esami) ripetuta più
delle altre e tutte le modalità hanno la stessa frequenza assoluta pari ad uno studente.
Qual è la modalità più alta? 30
Qual è la modalità più frequente? Nessuna in quanto tutte hanno la stessa frequenza pari ad 1.
Per individuare la moda di una variabile, dunque, bisogna chiedersi in primo luogo qual è la
variabile e poi quali sono le modalità e qual è la modalità con la frequenza più alta.
I quantili sono le intensità che dividono, dopo aver ordinato i dati, una distribuzione di
frequenza in un certo numero di parti uguali (ad esempio, la mediana è quel valore che divide in due
parti uguali l’insieme delle unità ordinate per grandezza, ovvero la distribuzione è divisa, rispetto a
tale valore, in due parti ognuna contenente il 50% delle unità). Se si divide la distribuzione in due
parti si parla di terzili (il primo terzile è quello che lascia alla sua sinistra un terzo delle osservazioni
e alla sua destra i rimanenti due terzi; il secondo terzile è quello che lascia alla sua sinistra i due
terzi e alla sua destra un terzo rimanente). Se si divide la distribuzione in tre parti si parla di quartili
(il primo quartile Q1 lascia alla sua sinistra il 25% dei casi e alla sua destra il rimanente 75%; il
secondo quartile Q2, che coincide con la mediana, lascia alla sua sinistra il 50% dei casi e alla sua
destra il rimanente 50%; il terzo quartile Q3 lascia alla sua sinistra il 75% dei casi e alla sua destra il
rimanente 25%). Se si divide la distribuzione in nove parti si parla di decili, …, in novantanove
parti si parla di centili, in cento parti si parla di percentili.
Pertanto, se X è un carattere con n modalità ordinate x1, x2, …, xn (x1 ≤ x2 ≤ … ≤ xn), per il calcolo
dei quartili si procede in maniera analoga a quanto visto in precedenza per la mediana:
-
se n è pari:
xn  xn
Q1 
-
4
4
1
2
se n è dispari:
Q1  x n 1
4
I quantili, dunque, si possono calcolare per tutte quelle variabili per le quali risulta possibile
ordinarne le modalità, ovvero per variabili qualitative ordinali, oltre che per tutte le variabili
quantitative.
Esempio.
Date le seguenti intensità (n = 7, numero dispari):
20; 65; 2; 10; 37; 15; 3
il loro quartile Q1 si ottiene ordinando dapprima le intensità in ordine crescente, ovvero:
x1 = 2; x2 = 3; x3 = 10; x4 = 15; x5 = 20; x6 = 37; x7 = 65
e poi considerando l’intensità che occupa il posto
n 1 7 1 8

  2 partendo dalla prima
4
4
4
osservazione, ovvero Q1 = x2 = 3. Analogamente il terzo quartile Q3 si ottiene considerando
l’intensità che occupa sempre il secondo posto partendo, però, dall’ultima osservazione, ovvero
Q3 = x6 = 37.
Esempio.
Date le seguenti intensità (n = 8, numero pari):
20; 65; 83; 10; 37; 15; 3; 2
il loro quartile Q1 si ottiene ordinando dapprima le intensità in ordine crescente, ovvero:
x1 = 2; x2 = 3; x3 = 10; x4 = 15; x5 = 20; x6 = 37; x7 = 65; x8 = 83
e poi considerando come primo quartile Q1 le intensità identificate dalle posizioni
n 8
  2,
4 4
n
8
 1   1  2  1  3 , precisamente x2 = 3; x3 = 10; effettuando infine la semisomma tra tali
4
4
numeri, si ottiene:
Q1 
3  10 13
  6,5
2
2
Per determinare poi il terzo quartile Q3 bisogna effettuare la semisomma tra le intensità che
occupano sempre la seconda e la terza posizione, partendo però da sinistra, ovvero:
Q3 
37  65 102

 51
2
2
La variabilità o mutabilità, ovvero la dispersione, è misurata, invece, dai cosiddetti indici di
variabilità, in grado di discriminare tra situazioni tra loro molto differenziate, cosa questa per la
quale l’utilizzo dei soli indici di posizione potrebbe risultare, non solo non sufficiente, ma
addirittura fuorviante.
La variabilità di un fenomeno, ovvero la sua attitudine ad assumere differenti modalità, e di
conseguenza diversi valori quantitativi in un certo periodo di tempo o in seguito all’influenza di un
altro fenomeno, è caratterizzata dai seguenti due aspetti:
-
dispersione: pone in rilievo di quanto le varie intensità o osservazioni differiscano da una
media prestabilita ovvero si addensino intorno ad una determinata media;
-
disuguaglianza o variabilità reciproca: evidenzia la diversità delle varie intensità o
osservazioni tra loro.
Gli indici di variabilità si distinguono in:
-
assoluti: sono espressi nella stessa unità di misura del fenomeno di cui calcolano la
dispersione o la disuguaglianza oppure in funzione di suddetta unità di misura (campo di
variazione, scarto semplice medio, varianza, scarto quadratico medio o deviazione
standard);
-
relativi: prescindono dall’unità di misura del fenomeno e si ottengono rapportando due
misure assolute oppure un indice assoluto al suo massimo; sono pertanto adatti per effettuare
confronti tra fenomeni diversi (coefficiente di variazione).
Il campo di variazione o range, R(X), di una sequenza di numeri è l’indice assoluto di variabilità
più semplice da calcolarsi: è ottenuto, infatti, dalla differenza tra il valore massimo e quello
minimo; in formule è dato da:
R(X) = max(xi) – min(xi)
Esempio.
Se si considerano le seguenti valutazioni delle tre prove degli esami di stato riportate da quattro
studenti:
STUDENTI
Nicola
Mary
Eleonora
Giacomo
PRIMA PROVA
3
5
8
9
SECONDA PROVA
2
7
8
8
TERZA PROVA
6
7
6
6
allora i range delle tre prove sono dati rispettivamente da:
R1(X) = 9 – 3 = 6
R2(X) = 8 – 2 = 6
R3(X) = 7 – 6 = 1
mentre le rispettive medie aritmetiche sono date da:
M a 1  3  5  8  9  25  6,25
4
4
M a 2  2  7  8  8  25  6,25
4
4
M a 3  6  7  6  6  25  6,25
4
4
Si può osservare, quindi, che nella prima e terza prova il range, pari a 6, è superiore rispetto a quello
della seconda prova, i dati sono più dispersi ed i risultati più eterogenei; nella seconda prova, in cui
il range è pari ad 1, invece, i dati sono più concentrati ed i risultati più omogenei. La distribuzione
della prima prova, inoltre, risulta diversa da quella della seconda prova, nonostante entrambe le
prove presentino lo stesso range.
Dunque:
-
più R è piccolo più i dati sono concentrati, più R è grande più i dati sono dispersi;
-
R è espresso nella stessa unità di misura dei dati;
-
R tiene conto solo dei dati estremi della distribuzione e non di tutti i dati: distribuzioni
diverse ma con gli stessi valori estremi, cioè, hanno uguale range.
Lo scarto semplice medio S(Ma) di una sequenza di numeri x1, x2, …, xn è la media aritmetica
dei valori assoluti degli scarti dei numeri stessi dalla loro media aritmetica Ma; in formule è dato da:
S M a  
x1  M a  x2  M a  ...  xn  M a
n
Si osservi che occorre considerare gli scarti in valore assoluto poiché ciò che interessa è lo
scostamento di ogni dato dalla media e non se il dato è minore o maggiore del valore medio stesso.
Del resto, com’è facile verificare, la media aritmetica degli scarti, non considerati in valore
assoluto, vale sempre zero.
Esempio.
Se si considerano le seguenti valutazioni delle tre prove degli esami di stato riportate da quattro
studenti:
STUDENTI
Nicola
Mary
Eleonora
Giacomo
PRIMA PROVA
3
5
8
9
SECONDA PROVA
2
7
8
8
TERZA PROVA
6
7
6
6
allora, essendo:
M a 1  M a 2  M a 3  6,25
gli scarti medi delle tre prove sono dati rispettivamente da:
S M a 1 
3  6,25  5  6,25  8  6,25  9  6,25
4
S M a 2 
2  6,25  7  6,25  8  6,25  8  6,25
S M a 3 
6  6,25  7  6,25  6  6,25  6  6,25
4
4

3,25  1,25  1,75  2,75 9
  2,25
4
4

4,25  0,75  1,75  1,75 8,5

 2,125
4
4

0,25  0,75  0,25  0,25 1,5

 0,375
4
4
Si può osservare, quindi, che nella prima prova lo scarto, pari a 2,25 (ovvero i valori della sequenza
si discostano mediamente di 2,25 dalla media), è superiore rispetto a quello della terza prova, i dati
sono più dispersi ed i risultati più eterogenei; nella terza prova, in cui lo scarto è pari a 0,375,
invece, i dati sono più concentrati ed i risultati più omogenei. La distribuzione della prima prova,
inoltre, risulta diversa da quella della seconda prova.
Dunque:
-
più S(Ma) è piccolo più i dati sono concentrati, più S(Ma) è grande più i dati sono dispersi;
-
S(Ma) è espresso nella stessa unità di misura dei dati;
-
S(Ma) tiene conto di tutti i dati della distribuzione.
La varianza di una sequenza di numeri x1, x2, …, xn è la media aritmetica dei quadrati degli
scarti dei numeri stessi dalla loro media aritmetica Ma; in formule è data da:
x1  M a 2  x2  M a 2  ...  xn  M a 2
2 
n
dove Dev  x1  M a   x2  M a   ...  xn  M a  , ovvero il numeratore della varianza, è detta
2
2
2
devianza.
Da un punto di vista sostanziale, però, la varianza presenta un notevole inconveniente, ovvero non è
direttamente confrontabile con la media o con altri valori della distribuzione proprio perché
espressa nell’unità di misura del fenomeno elevata al quadrato.
Lo scarto quadratico medio o deviazione standard  di una sequenza di numeri x1, x2, …, xn,
più sensibile dello scarto semplice medio, e per questo utilizzato sia per piccole variazioni nella
distribuzione dei dati intorno alla media sia per ovviare al problema della varianza sopra illustrato, è
la radice quadrata della varianza; in formule è dato da:
x1  M a 2  x2  M a 2  ...  xn  M a 2

n
Si osservi che tra lo scarto semplice medio e lo scarto quadratico medio vale la seguente
diseguaglianza:
S M a   
Esempio.
Se si considera la seguente sequenza di otto valori:
x1 = 4, x2 = 7, x3 = 9, x4 = 13, x5 = 14, x6 = 18, x7 = 21, x8 = 34
la cui media aritmetica è:
Ma 
4  7  9  13  14  18  21  34 120

 15
8
8
si ottiene la varianza pari a:
2 

4  152  7  152  9  152  13  152  14  152  18  152  21  152  34  152
8
 112   82   62   22   12  32  62  192
8

e lo scarto quadratico medio pari a:
632
 79
8


121  64  36  4  1  9  36  361

8

632
 79  8,8882
8
Il coefficiente di variazione CV, indice di variabilità relativo maggiormente usato, è definito dal
rapporto tra la deviazione standard ed la media aritmetica; in formule è dato da:
CV 

Ma
Si osservi che il coefficiente di variazione, espresso in genere in termini percentuali moltiplicando
CV per 100, è indipendente dall’unità di misura, ovvero è un numero puro utilizzato, sia per
misurare la variazione media del fenomeno in rapporto alla sua media aritmetica, sia per
confrontare la variabilità relativa di un fenomeno in circostanze differenti (ad esempio, la variabilità
della distribuzione per Età tra le varie regioni, la distribuzione dei Redditi per nazioni e per anno, la
variabilità del Peso rispetto al sesso, …). Il coefficiente di variazione, inoltre, è necessario tutte le
volte che si intende confrontare la variabilità di due fenomeni espressi in unità di misure non
confrontabili (ad esempio, la variabilità del Peso rispetto a quella dell’Altezza, la variabilità dei
Consumi di carburante rispetto alla variabilità dell’Usura dei pneumatici per una determinata marca
di autovetture, …).