Le medie Medie

annuncio pubblicitario
Marilena Pillati - Seminari di Statistica (SVIC)
"Le medie"
Le medie
Sono misure sintetiche che consentono il
passaggio da una pluralità di informazioni a
una sola modalità
Nella famiglia delle medie si distinguono:
{
{
medie lasche o di posizione determinate in
base alla loro frequenza o alla posizione
occupata nella graduatoria delle osservazioni
individuali
medie analitiche calcolate con operazioni
algebriche sui valori del carattere
Medie
{
Medie analitiche
z
z
z
{
Media aritmetica
Media geometrica
Media armonica
Medie di posizione
z
z
z
Moda
Mediana
Quantili
1
Marilena Pillati - Seminari di Statistica (SVIC)
"Le medie"
Media aritmetica
La media aritmetica di un insieme di n valori
osservati x1, x2, …, xn di un carattere
quantitativo X è pari alla somma dei valori
osservati divisa per il loro numero:
x =
n
1
(x1 + x2 + L + xn ) = 1 ∑ xi
n
n i =1
Media aritmetica
La media aritmetica è quella costante k che
sostituita a ciascun valore individuale x1, …, xn
lascia inalterato l’ammontare del carattere
n
∑
x j = nk
→
k=
j =1
u
∑
i =1
x i ni = nk
→
k =
1
n
n
∑x
j
=x
j =1
1
n
u
∑x n
i i
=x
i =1
2
Marilena Pillati - Seminari di Statistica (SVIC)
"Le medie"
Calcolo della media aritmetica
Espressione generale per il calcolo della
media aritmetica
x=
c
n
c = ammontare totale del carattere
n = numero di unità statistiche
Media aritmetica per un protocollo
elementare
Collettivo
in esame
88 individui iscritti al corso di Statistica
Carattere
osservato
Voto conseguito all’esame di Statistica
Protocollo elementare
{29, 29, 24, 20, 22, 28, 19, 19, 21, 26, 20, 24, 21,
23, 28, 22, 29, 26, 23, 28, 30, 20, 27, 22, 27, 20,
26, 29, 29, 23, 23, 24, 22, 25, 27, 26, 23, 18, 19,
20, 26, 22, 24, 20, 22, 21, 29, 30, 19, 24, 24, 26,
29, 25, 28, 26, 22, 27, 27, 29, 26, 26, 22, 27, 24,
24, 24, 21, 18, 22, 28, 23, 21}
x=
c
n
c = 29+29+…+23+21 = 2140
n = 88
19,
24,
26,
26,
29,
25,
25,
22,
29,
30,
25,
18,
25,
30,
20,
x = 24,32
3
Marilena Pillati - Seminari di Statistica (SVIC)
"Le medie"
Media aritmetica
per un protocollo elementare
Disponendo del protocollo elementare
l’espressione per il calcolo della media
aritmetica è
n
c
x= =
n
∑ xi
i=1
n
=
1 n
∑ xi
n i=1
Media aritmetica
Media aritmetica
del reddito:
del numero di componenti:
33364
2,77
4
Marilena Pillati - Seminari di Statistica (SVIC)
"Le medie"
Popolazione residente nella provincia
di Bologna al 01-01-2005
Età media italiani:
46,20 anni
Età media stranieri: 29,57 anni
Popolazione in eta’ lavorativa residente nella
provincia di Bologna al 01-01-2005
Età media italiani:
41,73 anni
Età media stranieri: 34,54 anni
Media aritmetica
per una distribuzione di frequenza
x=
c=
k
∑ ci
i=1
c = 2140
x=
c
n
=
k
∑ xini
i=1
n = 88
2140
= 24,32
88
5
Marilena Pillati - Seminari di Statistica (SVIC)
"Le medie"
Media aritmetica
per una distribuzione di frequenza
Disponendo della distribuzione di frequenza di
un carattere quantitativo discreto, con le
modalità non espresse in intervalli,
l’espressione per il calcolo della media
aritmetica è data da:
k
c
x =
=
n
∑x n
i i
i =1
k
∑n
i
i =1
Distribuzione delle famiglie per n° di componenti
N° Componenti
Famiglie
1
2
3
4
5
6
5
11
3
9
1
1
30
Totale
N° Comp medio = 2.77 (calcolato a partire dal protocollo elementare)
N° Comp medio =
1 ⋅ 5 + 2 ⋅ 11 + 3 ⋅ 3 + 4 ⋅ 9 + 5 ⋅ 1 + 6 ⋅ 1 83
=
= 2.77
30
30
6
Marilena Pillati - Seminari di Statistica (SVIC)
"Le medie"
Media aritmetica per una distribuzione
di frequenza con classi intervallari
Quando in una distribuzione la variabile X è divisa in
intervalli non si può calcolare l’ammontare effettivo del
carattere, ma solo cercare di approssimarlo assumendo
che tutte le unità della i-esima classe abbiano la
medesima modalità
k
c
x =
=
n
∑ xˆ n
i i
i =1
k
∑n
i
i =1
La modalità x̂ i è posta pari al valore centrale dell’intervallo
per classi chiuse, mentre per classi aperte è necessario
scegliere un valore che sintetizzi la distribuzione del
carattere su quell’intervallo
Esempio di media per una
distribuzione con classi intervallari
Tempo di percorrenza sui 30 metri di un campione
di 98 atleti. Determinare il tempo medio di
percorrenza sui 30 metri.
x=
c
n
c = 550
n = 98
x=
550
= 5,61
98
7
Marilena Pillati - Seminari di Statistica (SVIC)
"Le medie"
Distribuzione delle famiglie per reddito del nucleo familiare
Famiglie
Val centrale
Reddito
≤ € 10.000
€ 5 000
€ 15 000
€ 10.000 --| € 20.000
€ 20.000 --| € 30.000
€ 30.000 --| € 50.000
Totale
Reddito medio
Reddito medio
(1)
(2)
€ 135 000
€ 200 000
€ 200 000
30
€ 995 000
€ 25 000
€ 40 000
€ 75 000
> € 50.000
€ 10 000
2
9
8
5
6
€ 450 000
= € 33 364
= € 995 000 / 30 = € 33 166,67
(1) Calcolato a partire dal protocollo elementare
(2) Calcolato a partire dalla distribuzione di frequenza
Distribuzione delle aziende agricole per classe di superficie
(in migliaia di ettari) al 4° censimento generale dell’agricoltura
(21 ottobre 1990) - Fonte: Istat
Classe di
superficie
xj-1 |-- xj
fino a 1
1 |-- 2
2 |-- 3
3 |-- 5
5 |-- 10
10 |-- 20
20 |-- 50
50 e oltre
Totale
N° aziende
(in migliaia)
xi*
xi* ni
997
591
336
374
354
201
115
55
3023
0,5
1,5
2,5
4
7,5
15
35
175
498,5
886,5
840
1496
2655
3015
4025
9625
23041
Superficie media effettiva
22703
= 7,51
3023
Superficie media approssimata
x =
1
n
u
∑x
i =1
*
i ni
Superficie totale
effettiva
(in migliaia di ha)
482
815
799
1412
2436
2747
3432
10580
22703
=
23041
= 7,62
3023
8
Marilena Pillati - Seminari di Statistica (SVIC)
"Le medie"
Proprietà di associatività della media aritmetica
Dato un collettivo di n unità suddiviso in g gruppi
di numerosità n1, n2, … , ng si ha
x =
1
n
n
∑
xj =
j =1
x1n1 + x2 n2 + . . . + x g ng
n1 + n2 + . . . + ng
=
1
n
g
∑x n
i
i
i =1
Distribuzione delle famiglie per numero di
componenti e per sesso del capofamiglia
M
F
1
3
2
5
2
5
6
11
3
2
1
3
4
8
1
9
5
1
0
1
6
1
0
1
Totale
20
10
30
media
3.1
2.1
N° Componenti
x =
x M ⋅ nM + x F ⋅ nF
3,1 ⋅ 20 + 2,1 ⋅ 10
=
= 2,77
nM + nF
30
9
Marilena Pillati - Seminari di Statistica (SVIC)
"Le medie"
Media aritmetica ponderata
Se nel calcolo della media aritmetica si vuole attribuire
importanza diversa alle modalità di un carattere, si
assegna ad ognuna di esse un peso che ne esalti o ne
diminuisca l’importanza.
La media aritmetica ponderata di un carattere
quantitativo x con k modalità x1, x2, … , xk alle quali
sono attribuiti pesi p1, p2, … , pk
k
Mp =
x1 p1 + x2 p2 + ... + x j p j + ... + x k pk
p1 + p2 + ... + p j + ... + pk
∑x
j pj
j =1
k
=
∑p
j
j =1
La media aritmetica non funziona sempre…
BOLOGNA
04-feb
05-feb
06-feb
07-feb
08-feb
09-feb
10-feb
11-feb
12-feb
13-feb
70
44
37
59
60
82
69
48
86
60
Data la serie di numeri indice a base mobile di PM10
qual è l’indice medio nel periodo che va dal 4 al 9 febbraio?
t-1It
04-feb
05-feb
06-feb
07-feb
08-feb
09-feb
10-feb
-
0.629
0.841
1.595
1.017
1.367
0.842
11-feb
0.696
12-feb
13-feb
1.792
0.698
Media aritmetica dei 5 indici = 1.089
Se però considero tale indice medio nel periodo d’interesse
non ottengo a partire dal dato PM104feb=70 il valore
PM109feb=82
Infatti:
70 · (1.089 · 1.089 · 1.089 · 1.089 · 1.089) = 107 ≠ 82
10
Marilena Pillati - Seminari di Statistica (SVIC)
"Le medie"
Ricordando che:
4feb I 9feb = 4feb I5feb ⋅5feb I6 feb ⋅6 feb I7feb ⋅7feb I8feb ⋅8feb I9feb
4feb I9feb
= 0,629 ⋅ 0,841 ⋅ 1,595 ⋅ 1,017 ⋅ 1,367 = 1,17
Un’opportuna costante k da sostituire ai singoli
indici giornalieri dovrà essere tale che
k 5 = 1,17
k = 5 1,17 = 1,032
da cui:
Media geometrica
t-1I
t
04-feb
05-feb
06-feb
07-feb
08-feb
09-feb
-
0.629
0.841
1.595
1.017
1.367
10-feb
0.842
11-feb
0.696
12-feb
13-feb
1.792
0.698
Media geometrica dei 5 indici = 1,032
Se considero tale indice medio nel periodo d’interesse
ottengo a partire dal dato PM104feb=70 il valore
PM109feb=82
Infatti:
70 · (1,032 · 1,032 · 1,032 · 1,032 · 1,032) = 82
11
Marilena Pillati - Seminari di Statistica (SVIC)
"Le medie"
Media geometrica
La media geometrica di n valori distinti è data
dalla radice n-esima del loro prodotto
n
0
M ( X ) = n ∏ x j = x0 ,
xj > 0
j =1
per osservazioni raggruppate in una distribuzione
la media geometrica è così definita
0M ( X ) =
k
n
∏x
= x0 ,
ni
i
xi > 0
i =1
Media geometrica
anni
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
tassi di rendimento
fondi obbligazionari
-0,013
0,104
0,094
0,066
0,052
0,003
0,043
0,028
0,022
0,016
anni
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
tassi di rendimento
fondi azionari
-0,036
0,013
0,084
0,303
0,222
0,357
-0,088
-0,17
-0,263
0,101
;
Un investitore nel ’94 ha differenziato il suo portafoglio fondi,
investendo un capitale C in fondi obbligazionari e un capitale C’
in fondi azionari. Quale tipologia di fondo è risultata, nel
decennio considerato, più remunerativa, ovvero ha presentato
un rendimento medio annuo più elevato?
12
Marilena Pillati - Seminari di Statistica (SVIC)
"Le medie"
Media geometrica
C (1 + i1 )10 = C (1 + i1994 )(1 + i1995 )...(1 + i2003 )
′ )(1 + i1995
′ )...(1 + i2003
′ )
C ′(1 + i2 )10 = C ′(1 + i1994
i1 = 10 (1 + i1994 )(1 + i1995 )...( 1 + i2003 )
′ )(1 + i1995
′ )...( 1 + i2003
′ )
i2 = 10 (1 + i1994
i1 = 10 0,987 ⋅1,104 ⋅ ... ⋅1,016 = 0,041
i2 = 10 0,964 ⋅1,013 ⋅ ... ⋅1,101 = 0,035
Media armonica
Problema
Un ciclista percorre una salita con velocità v
costante e ridiscende per la strada con velocità
ancora costante ma pari al triplo della
precedente. La velocità media dell’intero
percorso di andata e ritorno è….
La velocità media aritmetica è 2v ma non è la
risposta esatta, perché tale velocità non
conserva il tempo di percorrenza effettivo
13
Marilena Pillati - Seminari di Statistica (SVIC)
"Le medie"
Media armonica
Detta s la lunghezza del percorso (sola andata), i
tempi di percorrenza per l’andata e il ritorno sono
t1=s/v (andata) e t2=s/3v (ritorno).
La velocità media dell’intero viaggio sarà quindi:
2s
2s
2s
2
3v 3
=
=
=
= 2⋅ = v
t1 + t 2 s + s
4 2
⎛1 1 ⎞ 1 + 1
s⎜ + ⎟
v 3v
⎝ v 3v ⎠ v 3v
Media armonica
−1
M (X ) =
n
n
−1
1
∑x
i =1
M (X ) =
i
n
k
1
ni
∑
i =1 xi
xi≠0
Condizione di invarianza
n
1
∑x
i
i
= n⋅
1
h
con
h=
n
n
1
i
i
∑x
14
Scarica