INDICI DI POSIZIONE CENTRALE
Una volta definito il collettivo statistico d’indagine vengono rilevati i caratteri oggetto di
studio e alla fine della rilevazione ci si trova con decine o centinaia di dati che , come si è
visto, possono essere disposti efficacemente in una tabella di frequenza.
Frequentemente risulta necessario sintetizzare la massa dei dati in modo tale da eseguire
facili e veloci raffronti con altri collettivi oppure raffrontando gli stessi collettivi
temporalmente o territorialmente .
Per sintetizzare una grande quantità di dati vengono utilizzati gli indici di posizione o valori
medi. Essi si distinguono in :
-
medie di calcolo, (media aritmetica, media geometrica, media armonica, media
quadratica) prendendo in considerazione tutti gli elementi del collettivo;
-
medie lasche, ( valore centrale, mediana, quartili e moda ) prendendo in
considerazione solo alcuni degli elementi del collettivo.
MEDIE DI CALCOLO
MEDIA
ARITMETICA
La media aritmetica, o semplicemente media, è quel valore che sostituito a tutti i termini
della distribuzione ne lascia invariata la somma.
Considerati gli N valori di una distribuzione statistica
Totale valori
N
valori
media
x1
x2
_
_
x
x
xi
…
_
…
x
…
…
xn
x1 + x2 + ... xi + ... xn = ∑ xi
i =1
_
_
_
_
_
x + x + ... x = N ⋅ x
x
N
_
N
_
Dalla definizione dovrà essere N ⋅ x = ∑ xi , isolando la media x si ottiene x =
∑x
i =1
i =1
i
N
MEDIA ARITMETICA
distribuzione
semplice
collettivo poco
numeroso e i valori
rilevati non si ripetono
indicato con x1 , x2 ,..., xi ,... xn , gli elementi e con N il numero totale degli
elementi la media aritmetica è data dalla formula:
N
xi
x1 + x2 + x3 + ... xi + ... xn ∑
i =1
x=
=
N
N
FACOLTÀ DI ECONOMIA PESCARA Corso di Laurea Triennale in ECONOMIA E COMMERCIO Classe L-33
STATISTICA Anno Accademico 2010-2011 Prof . Annibale ROCCO
LEZIONI DI STATISTICA DESCRITTIVA INDICI DI POSIZIONE Pagina 1 di 10
Esempio : dati i valori
6
distribuzione di
frequenza
collettivo numeroso e
i valori rilevati si
ripetono
∑x
1 + 3 + 5 + 7 + 15 + 17 48
=
=8
6
6
6
indicato con xi i valori e con ni le rispettive frequenze , con
N = 6,
1;3;5;7;15;17
x=
i
i =1
=
N = n1 + n2 + ...nn il numero totale delle frequenze, si costruisce la colonna
dei prodotti xi ⋅ ni e si calcola la somma; questa poi viene divisa per N:
n
x=
n
∑ xi ni
i =1
x=
oppure
N
∑x n
i i
i =1
n
∑n
i =1
i
Ritornando all’esempio delle altezze di cui alla tabella 6 si predispone la nuova tabella per il calcolo della
media aggiungendo il prodotto xi ⋅ ni :
Studenti distinti per statura in cm
Altezza
Frequenza assoluta
prodotti
xi
ni
xi ⋅ ni
165
2
330
168
3
504
169
2
338
170
2
340
172
2
344
173
2
346
176
1
176
177
1
177
180
2
360
181
2
362
182
1
182
totale
20
3459
valori per classi
si ipotizza che tutti i
valori siano uguali al
valore centrale della
classe
La media delle altezze è pertanto
n
x=
i
totale delle frequenze, si costruisce la colonna dei prodotti xi' ⋅ ni e si
calcola la somma; questa poi viene divisa per N:
n
Valore centrale della
classe
Frequenza
assoluta
prodotti
x ⋅ ni
x
ni
165-170
167,50
7
1172,5
170-175
172,50
6
1035
175-180
177,50
2
355
180-185
∑n
3.459
= 172,95 cm
20
=
Indicato con xi' il valore centrale di ogni classe ( semisomma degli
estremi della classe) e con ni le rispettive frequenze , con N il numero
xi − xi +1
totale
i i
i =1
n
i =1
x=
Classi di altezza
∑x n
'
i
182,50
5
20
'
i
912,5
3475
∑x n
'
i i
i =1
N
Il totale dei prodotti è 3.475 rispetto al
reale 3.459; la media delle altezze sarà
n
x=
∑x n
'
i i
i =1
N
=
3.475
= 173,75 cm
20
all’aumentare del collettivo la media così
ottenuta tenderà ad avvicinarsi sempre più al
valore reale.
FACOLTÀ DI ECONOMIA PESCARA Corso di Laurea Triennale in ECONOMIA E COMMERCIO Classe L-33
STATISTICA Anno Accademico 2010-2011 Prof . Annibale ROCCO
LEZIONI DI STATISTICA DESCRITTIVA INDICI DI POSIZIONE Pagina 2 di 10
Osservazioni sull’utilizzo della media aritmetica:
la media aritmetica non è indicata se all’interno della distribuzione figurano dei valori anomali che si discostino di molto dagli altri termini e
assumono un peso preponderante nel risultato sintetico.
Immaginiamo di calcolare il valore medio delle retribuzioni annue del personale di una impresa considerando i salari degli operai, gli
stipendi degli impiegati e gli emolumenti del personale dirigente; in un rapporto , ormai usuale, di 1 a 500 tra salario e indennità dirigenziale
la media aritmetica fornirebbe un valore di gran lunga superiore al salario unitario; è più opportuno calcolare la media dei salari e
confrontarli con i salari di altre imprese o per contesti territoriali o temporali diversi e lo stesso dicasi degli emolumenti dirigenziali.
Esempio:
personale
operai
impiegati
manager
totale
Importo in euro
12.000
15.000
600.000
frequenze
22
8
2
32
prodotti
264.000
120.000
1.200.000
1.584.000
La media di tutto il personale è pari a 1.584.000
valore
= 49.500
32
decisamente non rappresentativo. La media del solo personale
operai e impiegati è pari a 384.000 = 12.800 valore in linea con i
30
dati tabellari.
PROPRIETÀ DELLA MEDIA ARITMETICA
xi − x
Indicato con
a)
e la media,
i
− x) = 0
i
− x ) ⋅ ni = 0
nella distribuzione semplice
nella distribuzione di frequenza;
la somma dei quadrati degli scarti dalla media rispetto ad un qualunque altro valore è un minimo:
∑ (x
∑ (x
c)
i − esimo
la somma degli scarti è uguale a zero :
∑ (x
∑ (x
b)
lo scarto, differenza tra valore
i
i
− x) 2 = minimo nella distribuzione semplice
− x) 2 ⋅ ni = minimo nella distribuzione di frequenza
indicate con le lettere a e b delle costanti , con la lettera
considerino le seguenti espressioni :
•
a + X somma di una costante e di una variabile
•
a⋅ X
X
la variabile statistica e con la lettera
M
la media aritmetica si
prodotto di una costante per una variabile
a ⋅ X + b somma del prodotto di una costante per una variabile e di una costante,
•
valgono le seguenti proprietà:
M ( a ) = a : la media di una costante è uguale alla costante stessa ;
2) M ( a + X ) = a + M ( X ) : la media della somma di una costante e una variabile è uguale alla somma della costante e la media
1)
della variabile;
3)
M ( a ⋅ X ) = a ⋅ M ( X ) ; la media del prodotto di una costante per una variabile è uguale al prodotto della costante per la media
della variabile;
4)
M ( a ⋅ X + b) = a ⋅ M ( X ) + b
esempio:
a = 3; b = 5
x
1° valore
2° valore
totale
media
: questa proprietà deriva dalle precedenti.
2
4
6
3
a+x
5
7
12
6
a⋅ x
6
12
18
9
a⋅ x +b
11
17
28
14
Applicando le proprietà si ottengono gli stessi risultati :
M (a + X ) = a + M ( X ) = 3 + 3 = 6
M (a ⋅ X ) = a ⋅ M ( X ) = 3 ⋅ 3 = 9
M ( a ⋅ X + b) = a ⋅ M ( X ) + b = 3 ⋅ 3 + 5 = 14
FACOLTÀ DI ECONOMIA PESCARA Corso di Laurea Triennale in ECONOMIA E COMMERCIO Classe L-33
STATISTICA Anno Accademico 2010-2011 Prof . Annibale ROCCO
LEZIONI DI STATISTICA DESCRITTIVA INDICI DI POSIZIONE Pagina 3 di 10
MEDIA
GEOMETRICA
La media geometrica è quel valore tale che sostituito a tutti i termini della distribuzione ne
lascia invariato il prodotto.
Considerati gli N valori di una distribuzione statistica
prodotto valori
N
valori
media
x1
x2
_
_
xG
xG
xi
…
x1 ⋅ x2 ⋅ ... xi ⋅ ... xn = ∏ xi
xn
…
i =1
_
…
xG
N
 _ 
xG ⋅ xG ⋅ ... xG =  xG 
 
_
_
…
xG
_
_
N
N
Dalla definizione dovrà essere  x_  =
, estraendo la radice ennesima e isolando la
G
∏ xi

media x G si ottiene x G =
i =1
N
−
_

N
∏ xi
, la media geometrica è uguale alla radice ennesima del
i =1
prodotto dei fattori.
MEDIA GEOMETRICA
indicato con x1 , x2 ,..., xi ,... xn , gli elementi e con N il numero totale degli elementi la
distribuzione
media geometrica è data dalla formula:
semplice
−
xG = N
N
∏ xi
i =1
Esempio : dati i valori
2;2;16
N = 3,
−
xG = N
N
∏ xi
= 3 2 ⋅ 2 ⋅ 16 = 3 64 = 4
i =1
indicato con xi i valori e con ni le rispettive frequenze , con N
distribuzione di
frequenza
= n1 + n2 + ...nn il
numero totale delle frequenze, la media geometrica sarà uguale a :
−
xG = N
n
∏ xi
ni
i =1
Calcolo della media
geometrica
Il calcolo della media geometrica risulta gravoso se le frequenze sono elevate. Si
ricorre al foglio di calcolo oppure ai logaritmi mediante la formula
n
−
log x G =
Utilizzo della media
geometrica
∑ n log x
i
i
i =1
N
La media geometrica viene utilizzata quando si è interessati a conoscere il tasso
medio di incremento di una variabile nel tempo, esempio il tasso di variazione dei
prezzi, tasso di rendimento dei capitali, tasso di incremento della popolazione. La
media geometrica non viene utilizzata in presenza di valori nulli o negativi.
FACOLTÀ DI ECONOMIA PESCARA Corso di Laurea Triennale in ECONOMIA E COMMERCIO Classe L-33
STATISTICA Anno Accademico 2010-2011 Prof . Annibale ROCCO
LEZIONI DI STATISTICA DESCRITTIVA INDICI DI POSIZIONE Pagina 4 di 10
MEDIA
QUADRATICA
La media quadratica è quel valore tale che il suo quadrato sostituito a tutti i termini della
distribuzione lascia invariata la somma dei quadrati dei termini.
Considerati gli N valori di una distribuzione statistica
Totale valori
N
valori
Valori
quadratici
x1
x2
2
x2
x1
Quadrato
della media
2
−2
−2
xq
xq
xi
…
…
xi
2
…
−2
…
−2
xn
i =1
N
x1 + x2 + ... xi + ... xn = ∑ xi
2
2
2
2
2
2
i =1
−2
…
xq
x1 + x2 + ... xi + ... xn = ∑ xi
xn
…
−2
−2
_2
−2
x q + x q + ... x q = N ⋅ x q
xq
−2
N
Dalla definizione dovrà essere N ⋅ x q = ∑ xi2 , isolando il quadrato della media x q e
i =1
N
∑x
−
calcolando la radice quadrata si ottiene x q =
i =1
2
i
N
MEDIA QUADRATICA
indicato con x1 , x2 ,..., xi ,... xn , gli elementi e con N il numero totale degli elementi la
distribuzione
media quadratica è data dalla formula:
N
semplice
xq =
∑x
Esempio : dati i valori
xi
i valori e con
ni
frequenze, si calcolano i quadrati
2
2
i =1
xi
i =1
N
3
4 + 16 + 36
56
=
= 4,32...
3
3
=
le rispettive frequenze , con
2
2
i
2
i
xq =
N = 3,
indicato con
distribuzione di
2
3
2;4;6
∑x
x + x2 + x3 + ...xi + ... xn
=
N
2
2
1
N = n1 + n2 + ...nn il numero totale delle
, si costruisce la colonna dei prodotti
xi ⋅ ni
2
questa poi viene divisa per N, sotto radice quadrata:
n
frequenza
xq =
∑x
i
2
ni
i =1
n
oppure
N
xq =
∑x
i =1
n
Indicato con
xi'
2
i
ni
∑n
i =1
i
il valore centrale di ogni classe ( semisomma degli estremi della classe) e con
rispettive frequenze , con N il numero totale delle frequenze, si calcolano i quadrati
valori per classi
'2
xi
ni
le
, si costruisce la
2
colonna dei prodotti
xi' ⋅ ni
e si calcola la somma; questa poi viene divisa per N, sotto radice quadrata:
n
xq =
Utilizzo della media
quadratica
e si calcola la somma;
∑x
i =1
'2
i
ni
N
Essa è utilizzata per calcolare la media delle differenze tra i valori e un valore
prefissato e non risente di valori negativi o di differenze negative. La media quadratica
risente dei valori anomali in maniera maggiore rispetto alla media aritmetica.
FACOLTÀ DI ECONOMIA PESCARA Corso di Laurea Triennale in ECONOMIA E COMMERCIO Classe L-33
STATISTICA Anno Accademico 2010-2011 Prof . Annibale ROCCO
LEZIONI DI STATISTICA DESCRITTIVA INDICI DI POSIZIONE Pagina 5 di 10
MEDIA
ARMONICA
La media armonica è quel valore che sostituito a tutti i termini della distribuzione ne lascia
invariata la somma dei reciproci. ( I termini non devono essere nulli )
Considerati gli N valori di una distribuzione statistica
Totale valori
valori
x1
x2
…
xi
…
xn
reciproci
1
x1
1
x2
…
1
xi
…
1
xn
_
_
xa
xa
media
_
…
1
xa
1
1
N
1
1
+ ... _ + ... _ = ∑ _ = N ⋅ _
xa
xa
x a i =1 x a
xa
_
…
xa
N
1 1
1
1
1
+ + ... + ... = ∑
x1 x2
xi
xn i =1 xi
_
_
_
1
Dalla definizione dovrà essere N ⋅ _ = ∑
, isolando la media x a si ottiene x a =
x a i =1 xi
N
1
N
N
1
∑x
i =1
i
MEDIA ARMONICA
indicato con x1 , x2 ,..., xi ,... xn , gli elementi e con N il numero totale degli elementi la
distribuzione
media armonica è data dalla formula:
_
xa =
semplice
N
N
i =1
Esempio : dati i valori
N = 3,
2;5;6
_
xa =
3
3
1
∑
i =1 xi
=
1
∑x
i
3
3
3
90
=
=
=
= 3,46...
1 1 1 15 + 6 + 5 26 26
+ +
2 5 6
30
30
xi i valori e con ni le rispettive frequenze , con N = n1 + n2 + ...nn il
1
numero totale delle frequenze, si costruisce la colonna dei prodotti
⋅ ni e si calcola
xi
indicato con
distribuzione di
frequenza
la somma; N viene diviso per tale somma:
_
xa =
Utilizzo della media
armonica
N
1
ni
∑
i =1 xi
n
Si ricorre alla media armonica quando è necessario fare riferimento ai reciproci dei
valori; in generale quando tra due quantità esiste una relazione inversa come potere di
acquisto medio di una moneta e prezzo, consumo e durata di una merce.
FACOLTÀ DI ECONOMIA PESCARA Corso di Laurea Triennale in ECONOMIA E COMMERCIO Classe L-33
STATISTICA Anno Accademico 2010-2011 Prof . Annibale ROCCO
LEZIONI DI STATISTICA DESCRITTIVA INDICI DI POSIZIONE Pagina 6 di 10
MEDIE
LASCHE
Le medie lasche sono valori medi che vengono calcolati solo su alcuni valori della
distribuzione .
I principali tipi di medie lasche sono:
1. valore centrale;
2. mediana;
3. quartili;
4. moda.
Ordinati i valori rilevati in ordine crescente, il valore centrale si calcola
x1 + x n
.
2
VALORE
CENTRALE
come semisomma dei valori estremi
MEDIANA
Ordinati i valori rilevati in ordine crescente, la mediana è quell’indice che
bipartisce la distribuzione , cioè lascia un uguale numero di termini da una
parte e dall’altra.
vc =
1° CASO, DISTRIBUZIONE SEMPLICE : indicato con N il numero degli elementi disposti
in ordine crescente,
N +1
a) se N è dispari la mediana è la modalità che occupa la posizione
;
2
b) se N è pari la mediana è la modalità data dalla semisomma dei due termini che
N
N
) + ( + 1)
2
occupano la posizione centrale 2
.
2
(
Esempi distribuzione semplice :
A) 2; 5; 6; 7; 18
N=5 , dispari
B) 2; 5; 6; 8; 9;11 N=6, pari
Me =
5+1
= 3° , M e = 6
2
6 6
+ + 1 3° + 4° 6 + 8
Me = 2 2
=
=
=7
2
2
2
2° CASO, DISTRIBUZIONE DI FREQUENZA
indicato con N il numero degli elementi disposti in ordine crescente , si costruisce la colonna delle frequenze
cumulate,
se N è dispari la mediana è la modalità che occupa la posizione
N +1
;
2
se N è pari la mediana è la modalità data dalla semisomma dei due termini che occupano
N
N
) + ( + 1)
2
la posizione centrale 2
2
(
FACOLTÀ DI ECONOMIA PESCARA Corso di Laurea Triennale in ECONOMIA E COMMERCIO Classe L-33
STATISTICA Anno Accademico 2010-2011 Prof . Annibale ROCCO
LEZIONI DI STATISTICA DESCRITTIVA INDICI DI POSIZIONE Pagina 7 di 10
Esempi distribuzione di frequenza:
a) CASO N DISPARI
Modalità
N dispari,
Me =
Frequenze semplici
Frequenze cumulate
xi
ni
Ni
1
3
4
TOTALE
10
8
7
25
10
18
25
N + 1 25 + 1
=
= 13° la mediana occupa il 13° posto e pertanto sarà par i alla modalità
2
2
x2 = 3
b) CASO N
Modalità
Frequenze semplici
Frequenze cumulate
xi
ni
Ni
1
3
4
TOTALE
10
15
25
50
10
25
50
PARI
50  50 
N
N
+  + 1
) + ( + 1)
2  2
 = 25° + 26° = 3 + 4 = 7 = 3,5
2
2
N pari, M e =
=
2
2
2
2
2
la mediana si calcola come semisomma dei due valori centrali che occupano la posizione
(
25-esima e 26-esima .
3° CASO, DISTRIBUZIONE DI FREQUENZA PER CLASSI
si segue la stessa procedura della distribuzione di frequenza; una volta individuata la
classe mediana bisognerà procedere all’interpolazione lineare mediante il teorema dei
triangoli simili.
Classe di consumo kWh
Frequenze
semplici
assolute ni
Frequenze
cumulate
assolute N i
6
12
71
71
12
23
50
121
23
32
48
169
32
37
73
242
37
38
29
271
38
43
28
299
Totale
N=299, dispari; la mediana M e =
299
N + 1 299 + 1
=
= 150° occupa il 150° posto e pertanto è
2
2
pari alla classe mediana 23-32. Individuata la classe mediana si procede con
FACOLTÀ DI ECONOMIA PESCARA Corso di Laurea Triennale in ECONOMIA E COMMERCIO Classe L-33
STATISTICA Anno Accademico 2010-2011 Prof . Annibale ROCCO
LEZIONI DI STATISTICA DESCRITTIVA INDICI DI POSIZIONE Pagina 8 di 10
l’interpolazione lineare mediante il teorema dei triangoli simili. La classe 23-32 ha come
frequenze cumulate 121-169; la mediana, come si evince anche dal grafico, posta al 150°
posto avrà un valore compreso tra 23 e 32. L’ascissa della mediana ( M ) si ottiene
mediante l’interpolazione della retta AB ( punti noti ) impostando la seguente proporzione:
xM e − xA
yM e − y A
=
32 − 23 x M e − 23 9
9
xB − x A x M e − 23
=
=
=
=
= xM e =
⋅ 29 + 23 = 28,4375
y B − y A 150 − 121 169 − 121
29
48
48
PA QA
=
PM QB
P
Q
In generale si può impostare la seguente tabella:
estremi della
classe
estremi classe
frequenze
cumulate
xi −1
Fi −1
Me
FM e
xi
Fi
e ricavare la mediana mediante la formula dell’interpolazione lineare:
M e = xi −1 +
proprietà della
mediana
(
xi − xi −1
⋅ FM e − Fi −1
Fi − Fi −1
)
la somma dei valori assoluti degli scarti dalla mediana è un
minimo
n
∑x
i =1
i
− M e = minimo
FACOLTÀ DI ECONOMIA PESCARA Corso di Laurea Triennale in ECONOMIA E COMMERCIO Classe L-33
STATISTICA Anno Accademico 2010-2011 Prof . Annibale ROCCO
LEZIONI DI STATISTICA DESCRITTIVA INDICI DI POSIZIONE Pagina 9 di 10
Si chiama primo quartile Q1 di una distribuzione quel valore al di sotto del
quale stanno il 25% dei valori della variabile X e al di sopra del quale
stanno il 75% dei valori della variabile X;
il secondo quartile Q2 coincide con la mediana;
il terzo quartile Q3 è quel valore al di sotto del quale stanno il 75% dei
valori della variabile X e al di sopra del quale stanno il 25% dei valori della
variabile X.
Per il calcolo dei quartili si segue il procedimento per il calcolo della
mediana:
a. si dispongono i valori rilevati in ordine crescente;
b. si costruisce la tabella con le frequenze cumulate;
c. si verifica se il rapporto N/4 è intero :
1.
se N/4 è intero
Q1 sarà uguale alla semisomma dei valori che occuperanno le
posizioni
QUARTILI
N
N
e
+1
4
4
Q3 sarà uguale alla semisomma dei valori che occuperanno le
posizioni
2.
3N 3 N
e
+1
4
4
se N/4 non è intero
N 
 4  + 1
 3N 
Q3 sarà uguale al valore che occuperà la posizione
 4  + 1
N 
 3N  indica la parte intera della frazione
dove il simbolo   o
 4 
4
Q1 sarà uguale al valore che occuperà la posizione
DIFFERENZA
INTERQUARTILICA
MODA M o
distribuzione di frequenza
valori per classi
La differenza
Q3 − Q1
è chiamata DIFFERENZA INTERQUARTILICA
all’interno della quale si trovano il 50% dei valori della distribuzione.
è il valore della distribuzione che si presenta con la maggiore frequenza.
( disco più venduto, giocatore che ha segnato più goal )
indicato con ni le frequenze assolute dei valori xi , la moda è costituita
da quel valore x che si ripete più volte, cioè che assume la maggiore
frequenza n .
• se le classi hanno la stessa ampiezza la classe modale sarà quella
con maggiore frequenza;
• se le classi hanno diversa ampiezza,
1) si calcolano le ampiezze per ogni classe ai , differenza tra
estremo superiore ed estremo inferiore;
2) si calcolano i rapporti
ni
;
ai
3) la classe modale sarà quella corrispondente al rapporto più
grande.
Bibliografia : Leti, Statistica descrittiva; Girone-Salvemini , Lezioni di Statistica; Maffè, Statistica; Probabilità e statistica descrittiva
Bergamini,Trifone,Barozzi, Zanichelli; La Matematica nell’economia e nella finanza 2 Coeli, Falamischia, Minerva.
FACOLTÀ DI ECONOMIA PESCARA Corso di Laurea Triennale in ECONOMIA E COMMERCIO Classe L-33
STATISTICA Anno Accademico 2010-2011 Prof . Annibale ROCCO
LEZIONI DI STATISTICA DESCRITTIVA INDICI DI POSIZIONE Pagina 10 di 10