Misure di tendenza centrale

annuncio pubblicitario
Statistica
Misure di tendenza centrale
Misure di tendenza centrale
Medie ferme
Medie di posizione
* Media aritmetica
* Moda
* Media geometrica
* Mediana
Ecc.
51
Medie ferme
• Le medie ferme si calcolano usando tutti i
valori a disposizione.
• Rischio: è possibile che valori molto alti o
molto bassi con poca frequenza possano
falsare il valore centrale, o meglio quello
rappresentativo dei dati.
52
Docente: Ivan Zivko
1
Statistica
Medie Ferme: media aritmetica
• È la somma di tutti i valori diviso il loro
numero totale.
• Media aritmetica:
x  f  x  f  ....  xn  f n
x 1 1 2 2

N
n
x  f
i
i
i 1
N
53
Medie Ferme: media aritmetica
• Esempio 1: considera le note di 5 studenti:
– 3, 4, 5.5, 6, 4.5.
3  4  5.5  6  4.5 23
x

 4.6
5
5
54
Docente: Ivan Zivko
2
Statistica
Medie Ferme: media aritmetica
• Osservazione: la media aritmetica si può
calcolare disponendo anche solo delle
frequenze relative.
x1  f1  ....  xn  f n
f
f
 x1  1  ...xn  n
N
N
N
 x1  f rel .1  ...  xn  f rel .n
x
55
Medie Ferme: media aritmetica
• Esempio 2: se i dati sono molti e dobbiamo
suddividerli in una tabella bisognerà usare le
frequenze.
NOTE
N. Studenti (Freq.
Freq. relativa
Assoluta)
3
4
0.17
4
6
0.25
4.5
8
0.33
5
3
0.125
5.5
2
0.083
6
1
0.042
TOTALE
24
1
56
Docente: Ivan Zivko
3
Statistica
Medie Ferme: media aritmetica
• Esempio 2: per calcolare la media aritmetica si
possono usare sia le frequenze assolute che
quelle relative.
3  4  4  6  4.5  8  5  3  5.5  2  6 1 104
x

 4.33
24
24
x  0.17  3  0.25  4  0.33  4.5  0.125  5  0.083  5.5  0.042  6  4.33
57
Medie Ferme: media aritmetica
• Se i dati sono suddivisi in classi per calcolare la
media aritmetica bisogna prendere i valori
centrali delle classi.
• Esempio 3: salario dei dipendenti.
Classi di stipendio (in
migliaia di CHF)
Numero dipendenti
(Freq. Assoluta)
Centro classi
[50, 60[
10
55
[60, 70[
20
65
[70, 80[
15
75
TOTALE
45
x
Docente: Ivan Zivko
55 10  65  20  75 15 2975

 66.11
45
45
58
4
Statistica
Medie Ferme: media aritmetica
• È chiaro che suddividendo i dati in classi
perdiamo delle informazioni, e quindi
commetteremo un piccolo errore.
• L’errore dovuto all’uso delle classi sarà:
a
err. 
2x  a
59
Medie Ferme: media aritmetica
• La media aritmetica ha in genere una buona
stabilità, che cresce con l'aumentare dei dati.
• Quando nei dati ci sono valori estremi
particolarmente „pesanti“ la media aritmetica
può essere molto influenzata da essi anche se
in realtà non hanno una grande frequenza.
60
Docente: Ivan Zivko
5
Statistica
Medie Ferme: media geometrica
• La media geometrica viene usata per dati che
variano in progressione temporale, per
esempio per gli indici.
• Media geometrica:
f1
f2
x  x1  x2  ....  xnf n
N
61
Medie Ferme: media geometrica
• Esempio: È dato un bene di valore C. Questo
bene nel primo anno aumenta il valore dell’ 8%,
nel secondo del 12%, nel terzo del 9% e nel
quarto del 5%. Si vuole trovare l’aumento
percentuale medio. Da ciò si possono trovare i
moltiplicatori:
M 1  C  (1  0.08)
M 2  M 1  (1  0.12)  C  (1  0.08)  (1  0.12)
ecc.
62
Docente: Ivan Zivko
6
Statistica
Medie Ferme: media geometrica
• Quindi alla fine dei quattro anni l’aumento si
calcolerà come segue:
C  (1  0.08)  (1  0.12)  (1  0.09)  (1  0.05) 
 C 1.08 1.12 1.09 1.05  C 1.3843872
• Il moltiplicatore medio sarà:
4
1.3843872  1.0847
Che equivale a un aumento percentuale annuo
del
0.0847  8.47%
63
Medie Ferme: media geometrica
• Se avessimo fatto la media aritmetica
avremmo ottenuto un aumento dell’8.5%.
• Se per ogni anno usiamo questo aumento non
otteniamo il risultato esatto.
64
Docente: Ivan Zivko
7
Statistica
Medie di posizione
• Come detto quando ci sono valori estremi troppo
grandi la media aritmetica non va più bene.
• Non possiamo semplicemente non tenere conto di
questi valori, perchè non seguiremmo i principi
fondamentali della statistica.
• A differenza delle medie ferme con le medie di
posizione possiamo anche cercare il valore medio di
variabili qualitative.
65
Medie di posizione: Moda
• La moda è quella media che viene associata alla
modalità con frequenza più alta.
• Essa è tanto più esatta quanto più la sua frequenza
è elevata rispetto alle altre (se è maggiore del 50%
è molto buona).
• Se le frequenze sono simili la moda perde la sua
efficacia. Se ci sono due modalità con frequenza
uguale si dice che la classe è bimodale.
66
Docente: Ivan Zivko
8
Statistica
Medie di posizione: Moda
• Esempio 1: colore dei capelli di un gruppo.
Colore capelli
Frequenza
assoluta
Castani
70
Biondi
30
Rossi
30
Altro
10
Moda  Castani
67
Medie di posizione: Moda
• Il calcolo diventa un po’ più complicato se
abbiamo dei dati suddivisi in classi.
• Prima di tutto bisogna determinare la classe
modale, che è semplicemente la classe con
frequenza più elevata.
• Per trovare il valore modale si userà la formula
poi:
1
Moda  Linf . 
a
1   2
68
Docente: Ivan Zivko
9
Statistica
Medie di posizione: Moda
Linf .  Limite inferiore della classe modale
1  (Freq. assoluta classe modale)  (Freq. ass. classe precedente)
 2  (Freq. assoluta classe modale)  (Freq. ass. classe successiva)
a  ampiezza delle classi
69
Medie di posizione: Moda
• Esempio 2: altezze di un gruppo.
Classi (Altezza)
Freq. assoluta
[158, 162[
4
[162, 166[
7
[166, 170[
13
[170, 174[
18
[174, 178[
8
Totale
50
70
Docente: Ivan Zivko
10
Statistica
Medie di posizione: Moda
• La classe modale è la classe [170, 174[.
Usando la formula:
(18  13)
5
 4  170 
4 
(18  13)  (18  8)
5  10
5
 170   4  170  1.333  171.333
15
Moda  170 
71
Medie di posizione: Mediana
• Si definisce mediana di un insieme di elementi,
disposti in ordine crescente o decrescente, il
valore che occupa la posizione centrale.
• Esempio 1: se il numero di elementi è dispari.
8, 12, 7, 4, 9, 10, 55
Bisogna prima metterli in ordine crescente.
4, 7, 8, 9, 10, 12, 55
Mediana  9
Docente: Ivan Zivko
72
11
Statistica
Medie di posizione: Mediana
• Esempio 2: se il numero di elementi è pari.
36, 72, 82, 84, 98, 105
I due valori centrali sono 82 e 84, perciò:
Mediana 
82  84
 83
2
73
Medie di posizione: Mediana
• Se i dati sono molti, e quindi vengono
rappresentati in una tabella per determinare la
mediana si guardano le frequenze cumulate.
• La mediana è quella modalità in cui la
frequenza cumulata supera il 50%.
74
Docente: Ivan Zivko
12
Statistica
Medie di posizione: Mediana
• Esempio 3: numero di interrogazioni per
studente.
Numero
interrogazioni
Freq. assoluta
Freq. cumulata
0
3
3
1
6
9
2
4
13
3
2
15
Totale
75
Medie di posizione: Mediana
• Esempio 3: in questo caso la frequenza
cumulata viene superata nella seconda
modalità, quindi:
Mediana  1
76
Docente: Ivan Zivko
13
Statistica
Medie di posizione: Mediana
• Se i dati sono suddivisi in classi bisogna prima di
tutto determinare la classe mediana, che è la
classe in cui la frequenza cumulata supera il
50%.
• Poi per trovare il valore mediano si userà la
formula:
N
 f cumulata classe precedente
Mediana  Linf .  2
f classe mediana
a
77
Medie di posizione: Mediana
• Esempio 3: prendiamo l’esempio delle altezze.
Classi (Altezza)
Freq. assoluta
Freq. cumulata
[158, 162[
4
4
[162, 166[
7
11
[166, 170[
14
25
[170, 174[
17
42
[174, 178[
8
50
Totale
50
78
Docente: Ivan Zivko
14
Statistica
Medie di posizione: Mediana
• La classe mediana è la classe [170, 174[.
Usando la formula:
50
 11
25  11
Mediana  166  2
 4  166 
4 
14
14
14
 166   4  170
14
79
Docente: Ivan Zivko
15
Scarica