Variabilità per variabili qualitative nominali ed ordinali. Variabilità

Esercitazione
3
A. Iodice
La variabilità
Esercitazione 3
variabilità per
variabili
qualitative
Statistica
Indici di
eterogeneità
La varianza
Alfonso Iodice D’Enza
[email protected]
Altri indici di
variabilità
Mutua
variabilità
Esercizio sulla
variabilità
Università degli studi di Cassino
A. Iodice ()
Esercitazione 3
Statistica
1 / 31
Outline
Esercitazione
3
A. Iodice
1
La variabilità
La variabilità
variabilità per
variabili
qualitative
Indici di
eterogeneità
La varianza
Altri indici di
variabilità
Mutua
variabilità
Esercizio sulla
variabilità
A. Iodice ()
Esercitazione 3
Statistica
2 / 31
Outline
Esercitazione
3
A. Iodice
1
La variabilità
2
variabilità per variabili qualitative
La variabilità
variabilità per
variabili
qualitative
Indici di
eterogeneità
La varianza
Altri indici di
variabilità
Mutua
variabilità
Esercizio sulla
variabilità
A. Iodice ()
Esercitazione 3
Statistica
2 / 31
Outline
Esercitazione
3
A. Iodice
1
La variabilità
2
variabilità per variabili qualitative
3
Indici di eterogeneità
La variabilità
variabilità per
variabili
qualitative
Indici di
eterogeneità
La varianza
Altri indici di
variabilità
Mutua
variabilità
Esercizio sulla
variabilità
A. Iodice ()
Esercitazione 3
Statistica
2 / 31
Outline
Esercitazione
3
A. Iodice
1
La variabilità
2
variabilità per variabili qualitative
3
Indici di eterogeneità
4
La varianza
La variabilità
variabilità per
variabili
qualitative
Indici di
eterogeneità
La varianza
Altri indici di
variabilità
Mutua
variabilità
Esercizio sulla
variabilità
A. Iodice ()
Esercitazione 3
Statistica
2 / 31
Outline
Esercitazione
3
A. Iodice
1
La variabilità
2
variabilità per variabili qualitative
3
Indici di eterogeneità
4
La varianza
5
Altri indici di variabilità
La variabilità
variabilità per
variabili
qualitative
Indici di
eterogeneità
La varianza
Altri indici di
variabilità
Mutua
variabilità
Esercizio sulla
variabilità
A. Iodice ()
Esercitazione 3
Statistica
2 / 31
Outline
Esercitazione
3
A. Iodice
1
La variabilità
2
variabilità per variabili qualitative
3
Indici di eterogeneità
4
La varianza
5
Altri indici di variabilità
6
Mutua variabilità
La variabilità
variabilità per
variabili
qualitative
Indici di
eterogeneità
La varianza
Altri indici di
variabilità
Mutua
variabilità
Esercizio sulla
variabilità
A. Iodice ()
Esercitazione 3
Statistica
2 / 31
Outline
Esercitazione
3
A. Iodice
1
La variabilità
2
variabilità per variabili qualitative
3
Indici di eterogeneità
4
La varianza
5
Altri indici di variabilità
6
Mutua variabilità
7
Esercizio sulla variabilità
La variabilità
variabilità per
variabili
qualitative
Indici di
eterogeneità
La varianza
Altri indici di
variabilità
Mutua
variabilità
Esercizio sulla
variabilità
A. Iodice ()
Esercitazione 3
Statistica
2 / 31
Il concetto di variabilità
Esercitazione
3
A. Iodice
La variabilità
variabilità per
variabili
qualitative
La variabilità si definisce come l’attitudine di un fenomeno ad
assumere modalità differenti.
La variabilità può essere misurata in diversi modi:
Indici di
eterogeneità
La varianza
Altri indici di
variabilità
Mutua
variabilità
Esercizio sulla
variabilità
A. Iodice ()
Esercitazione 3
Statistica
3 / 31
Il concetto di variabilità
Esercitazione
3
A. Iodice
La variabilità
variabilità per
variabili
qualitative
La variabilità si definisce come l’attitudine di un fenomeno ad
assumere modalità differenti.
La variabilità può essere misurata in diversi modi:
variabilità delle singole modalità x1 , x2 , . . . , xn rispetto ad
un indice di posizione
Indici di
eterogeneità
La varianza
mutua variabilità
Altri indici di
variabilità
variabilità delle modalità x1 , x2 , . . . , xn ordinate in modo
crescente (usando la f. di ripartizione)
Mutua
variabilità
variabilità delle frequenze relative (applicabile anche a
mutabili)
Esercizio sulla
variabilità
A. Iodice ()
Esercitazione 3
Statistica
3 / 31
Requisiti per indici di variabilità
Esercitazione
3
A. Iodice
La variabilità
variabilità per
variabili
qualitative
Un indice per la misura della variabilità deve avere le seguenti
caratteristiche
Indici di
eterogeneità
La varianza
Altri indici di
variabilità
Mutua
variabilità
Esercizio sulla
variabilità
A. Iodice ()
Esercitazione 3
Statistica
4 / 31
Requisiti per indici di variabilità
Esercitazione
3
A. Iodice
La variabilità
variabilità per
variabili
qualitative
Un indice per la misura della variabilità deve avere le seguenti
caratteristiche
un indice di variabilità deve assumere valori maggiori o
uguali a 0
Indici di
eterogeneità
La varianza
Altri indici di
variabilità
Mutua
variabilità
Esercizio sulla
variabilità
A. Iodice ()
Esercitazione 3
Statistica
4 / 31
Requisiti per indici di variabilità
Esercitazione
3
A. Iodice
La variabilità
variabilità per
variabili
qualitative
Un indice per la misura della variabilità deve avere le seguenti
caratteristiche
un indice di variabilità deve assumere valori maggiori o
uguali a 0
Indici di
eterogeneità
La varianza
un indice di variabilità calcolato su una distribuzione di
costanti ugulae a 0
Altri indici di
variabilità
Mutua
variabilità
Esercizio sulla
variabilità
A. Iodice ()
Esercitazione 3
Statistica
4 / 31
Requisiti per indici di variabilità
Esercitazione
3
A. Iodice
La variabilità
variabilità per
variabili
qualitative
Un indice per la misura della variabilità deve avere le seguenti
caratteristiche
un indice di variabilità deve assumere valori maggiori o
uguali a 0
Indici di
eterogeneità
La varianza
un indice di variabilità calcolato su una distribuzione di
costanti ugulae a 0
Altri indici di
variabilità
aggiungendo una costante alla variabile osservata, il valore
dell’indice non deve cambiare
Mutua
variabilità
Esercizio sulla
variabilità
A. Iodice ()
Esercitazione 3
Statistica
4 / 31
Il concetto di mutabilità
Esercitazione
3
A. Iodice
La variabilità
variabilità per
variabili
qualitative
In caso di variabili qualitative la variabilità del carattere
espressa in termini di mutabilità, definita come l’attitudine di
un carattere ad assumere differenti modalità qualitative.
Indici di
eterogeneità
La varianza
Altri indici di
variabilità
Mutua
variabilità
Esercizio sulla
variabilità
A. Iodice ()
Esercitazione 3
Statistica
5 / 31
Il concetto di mutabilità
Esercitazione
3
A. Iodice
La variabilità
variabilità per
variabili
qualitative
In caso di variabili qualitative la variabilità del carattere
espressa in termini di mutabilità, definita come l’attitudine di
un carattere ad assumere differenti modalità qualitative.
perfetta omogeneità: tutte le unità statistiche assumono la
stessa modalità del carattere qualitativo
Indici di
eterogeneità
La varianza
massima disomogeneità: le modalità del carattere hanno
tutte la stessa frequenza assoluta (relativa)
Altri indici di
variabilità
Mutua
variabilità
Esercizio sulla
variabilità
A. Iodice ()
Esercitazione 3
Statistica
5 / 31
Il concetto di mutabilità
Esercitazione
3
A. Iodice
La variabilità
variabilità per
variabili
qualitative
In caso di variabili qualitative la variabilità del carattere
espressa in termini di mutabilità, definita come l’attitudine di
un carattere ad assumere differenti modalità qualitative.
perfetta omogeneità: tutte le unità statistiche assumono la
stessa modalità del carattere qualitativo
Indici di
eterogeneità
La varianza
massima disomogeneità: le modalità del carattere hanno
tutte la stessa frequenza assoluta (relativa)
Altri indici di
variabilità
Mutua
variabilità
Esercizio sulla
variabilità
Le situazioni intermedie sono caratterizzate da un diverso grado
di eterogeneità.
A. Iodice ()
Esercitazione 3
Statistica
5 / 31
eterogeneità
Esercitazione
3
A. Iodice
La variabilità
variabilità per
variabili
qualitative
L’eterogeneità misura la variabilità delle frequenze relative
(f1 , f2 , . . . , fk ) delle k modalità del carattere.
Indici di
eterogeneità
La varianza
Altri indici di
variabilità
Mutua
variabilità
Esercizio sulla
variabilità
A. Iodice ()
Esercitazione 3
Statistica
6 / 31
eterogeneità
Esercitazione
3
A. Iodice
La variabilità
variabilità per
variabili
qualitative
L’eterogeneità misura la variabilità delle frequenze relative
(f1 , f2 , . . . , fk ) delle k modalità del carattere.
minima eterogeneità: si manifesta una sola modalità j la
cui frequenza relativa fj = 1: un indice di eterogeneità
deve avere valore 0 in questo caso
Indici di
eterogeneità
La varianza
Altri indici di
variabilità
massima eterogeneità: Le frequenze relative sono tutte
uguali: fi = k1 , con i = 1, . . . , k e k numero di modalità
del carattere
Mutua
variabilità
Esercizio sulla
variabilità
A. Iodice ()
Esercitazione 3
Statistica
6 / 31
Indici di eterogeneità: l’indice di Gini (G)
Esercitazione
3
A. Iodice
La variabilità
L’indice per la misura della eterogeneità proposto da Gini dato
da
k
X
G=1−
fi2
variabilità per
variabili
qualitative
i=1
Indici di
eterogeneità
La varianza
Altri indici di
variabilità
Mutua
variabilità
Esercizio sulla
variabilità
A. Iodice ()
Esercitazione 3
Statistica
7 / 31
Indici di eterogeneità: l’indice di Gini (G)
Esercitazione
3
A. Iodice
La variabilità
L’indice per la misura della eterogeneità proposto da Gini dato
da
k
X
G=1−
fi2
variabilità per
variabili
qualitative
i=1
Indici di
eterogeneità
in caso di minima eterogeneità, G = 0
La varianza
in caso di massima eterogeneità l’indice assume valore
G = 1 − k1
Altri indici di
variabilità
Mutua
variabilità
Esercizio sulla
variabilità
A. Iodice ()
Esercitazione 3
Statistica
7 / 31
Indici di eterogeneità: l’indice di Gini (G)
Esercitazione
3
A. Iodice
La variabilità
L’indice per la misura della eterogeneità proposto da Gini dato
da
k
X
G=1−
fi2
variabilità per
variabili
qualitative
i=1
Indici di
eterogeneità
in caso di minima eterogeneità, G = 0
La varianza
in caso di massima eterogeneità l’indice assume valore
G = 1 − k1
Altri indici di
variabilità
Mutua
variabilità
Esercizio sulla
variabilità
Avendo definito il valore massimo dell’indice, possibile
ottenerne la versione normalizzata G∗
G∗ =
A. Iodice ()
Esercitazione 3
k×G
k−1
Statistica
7 / 31
Esempio di applicazione dell’indice di Gini (G)
Esercitazione
3
A. Iodice
La variabilità
variabilità per
variabili
qualitative
Una nuova azienda informatica immette sul mercato una
gamma di prodotti. Dopo i primi sei mesi la vendita dei
prodotti risulta ripartita tra le varie categorie secondo la
seguente distribuzione di frequenze:
Indici di
eterogeneità
La varianza
Altri indici di
variabilità
Mutua
variabilità
Esercizio sulla
variabilità
A. Iodice ()
Esercitazione 3
Statistica
8 / 31
Esempio di applicazione dell’indice di Gini (G)
Esercitazione
3
A. Iodice
La variabilità
variabilità per
variabili
qualitative
Una nuova azienda informatica immette sul mercato una
gamma di prodotti. Dopo i primi sei mesi la vendita dei
prodotti risulta ripartita tra le varie categorie secondo la
seguente distribuzione di frequenze:
Indici di
eterogeneità
La varianza
Altri indici di
variabilità
Mutua
variabilità
Esercizio sulla
variabilità
La colonna promo riguarda le frequenze delle vendite per
categoria di prodotto dopo una politica di promozioni sui
diversi prodotti
A. Iodice ()
Esercitazione 3
Statistica
8 / 31
Esempio di applicazione dell’indice di Gini (G)
Esercitazione
3
A. Iodice
La variabilità
variabilità per
variabili
qualitative
Indici di
eterogeneità
La varianza
Altri indici di
variabilità
Mutua
variabilità
Esercizio sulla
variabilità
A. Iodice ()
Esercitazione 3
Statistica
9 / 31
Esempio di applicazione dell’indice di Gini (G)
Esercitazione
3
A. Iodice
G=1−
La variabilità
variabilità per
variabili
qualitative
k
X
fi2 = 1 − [(0.2094)2 +
i=1
+ (0.3535)2 + (0.1337)2 +
Indici di
eterogeneità
+ (0.1071)2 + (0.1964)2 ] =
La varianza
= 1 − 0.2357 = 0.7633
Altri indici di
variabilità
Mutua
variabilità
Esercizio sulla
variabilità
A. Iodice ()
Esercitazione 3
Statistica
9 / 31
Esempio di applicazione dell’indice di Gini (G)
Esercitazione
3
A. Iodice
G=1−
La variabilità
variabilità per
variabili
qualitative
k
X
fi2 = 1 − [(0.2094)2 +
i=1
+ (0.3535)2 + (0.1337)2 +
Indici di
eterogeneità
+ (0.1071)2 + (0.1964)2 ] =
La varianza
= 1 − 0.2357 = 0.7633
Altri indici di
variabilità
Mutua
variabilità
l’indice in versione normalizzata G∗ dato da
G∗ =
Esercizio sulla
variabilità
A. Iodice ()
k×G
5 × 0.7633
=
= 3.8165/4 = 0.9541
k−1
5−1
Esercitazione 3
Statistica
9 / 31
Esempio di applicazione dell’indice di Gini (G)
Esercitazione
3
A. Iodice
La variabilità
variabilità per
variabili
qualitative
Indici di
eterogeneità
La varianza
Altri indici di
variabilità
Mutua
variabilità
Esercizio sulla
variabilità
A. Iodice ()
Esercitazione 3
Statistica
10 / 31
Esempio di applicazione dell’indice di Gini (G)
Esercitazione
3
A. Iodice
Gpromo = 1 −
La variabilità
k
X
fi2 = 1 − [(0.3045)2 +
i=1
+ (0.1824)2 + (0.0074)2 +
variabilità per
variabili
qualitative
+ (0.3281)2 + (0.1777)2 ] =
Indici di
eterogeneità
= 1 − 0.2652 = 0.7348
La varianza
Altri indici di
variabilità
Mutua
variabilità
Esercizio sulla
variabilità
A. Iodice ()
Esercitazione 3
Statistica
10 / 31
Esempio di applicazione dell’indice di Gini (G)
Esercitazione
3
A. Iodice
Gpromo = 1 −
La variabilità
k
X
fi2 = 1 − [(0.3045)2 +
i=1
+ (0.1824)2 + (0.0074)2 +
variabilità per
variabili
qualitative
+ (0.3281)2 + (0.1777)2 ] =
Indici di
eterogeneità
= 1 − 0.2652 = 0.7348
La varianza
Altri indici di
variabilità
l’indice in versione normalizzata G∗ dato da
Mutua
variabilità
G∗promo =
Esercizio sulla
variabilità
k×G
5 × 0.7348
=
= 3.6738/4 = 0.9185
k−1
5−1
Risultando essere G > Gpromo si pu concludere che la politica
di promozioni ha fatto diminuire l’eterogeneità (aumentare
l’omogeneità) delle vendite nelle diverse categorie di prodotti
A. Iodice ()
Esercitazione 3
Statistica
10 / 31
Indice di dispersione per variabili qualitative
ordinate ordinate
Esercitazione
3
A. Iodice
La variabilità
variabilità per
variabili
qualitative
Indici di
eterogeneità
In caso di variabili qualitative con modalità ordinabili è possibile calcolare
l’eterogeneità attraverso l’indice di Gini. In questo modo tuttavia non si tiene
conto della relazione d’ordine che sussiste tra le modalità delle variabili.
L’indice D
L’indice D per il calcolo della dispersione in variabili qualitative ordinali si basa
sulle frequenze cumulate Fj e retrocumulate RFj , con j = 1, . . . , k, dove k è il
numero di modalità della variabile. Ricordando che la frequenza relativa cumulata
Fj della j-esima modalità è data da:
Fj = f1 + f2 + . . . + fj
La varianza
Altri indici di
variabilità
Mutua
variabilità
Esercizio sulla
variabilità
e che la frequenza relativa retrocumulata RFj della j-esima delle K modalità del
carattere è data da
RFj = fj + fj+1 + . . . + fK ;
L’indice D è il seguente:
D=
k
X
[Fj (1 − Fj ) + RFj (1 − RFj )]
j=1
A. Iodice ()
Esercitazione 3
Statistica
11 / 31
Indice di dispersione per variabili qualitative
ordinate ordinate
Esercitazione
3
A. Iodice
Esempio di calcolo dell’indice D
t.studio
analf abeta
lic.elementare
lic.media
diploma
laurea
tot
La variabilità
variabilità per
variabili
qualitative
Indici di
eterogeneità
absF reqs
5
5
3
3
4
20
relF reqs
0.25
0.25
0.15
0.15
0.2
1.00
Fj
0.25
0.50
0.65
0.80
1.00
RFj
1.00
0.75
0.50
0.35
0.20
La varianza
Altri indici di
variabilità
Mutua
variabilità
D=
k
X
[Fj (1 − Fj ) + RFj (1 − RFj )] =
j=1
Esercizio sulla
variabilità
= [0.25(1 − 0.25) + 1(1 − 1)] + [0.5(1 − 0.5) + 0.75(1 − 0.75)] +
+ [0.65(1 − 0.65) + 0.5(1 − 0.5)] + [0.8(1 − 0.8) + 0.35(1 − 0.35)] +
+ [1(1 − 1) + 0.2(1 − 0.2)] = 1.65
A. Iodice ()
Esercitazione 3
Statistica
12 / 31
Definizione di varianza
Esercitazione
3
A. Iodice
La variabilità
variabilità per
variabili
qualitative
La varianza un’indice che misura la variabilità di una variabile
X rispetto alla media aritmetica. In particolare la varianza σ 2
data dalla media dei quadrati degli scarti (delle modalità dalla
media)
Indici di
eterogeneità
La varianza
Altri indici di
variabilità
Mutua
variabilità
Esercizio sulla
variabilità
A. Iodice ()
Esercitazione 3
Statistica
13 / 31
Definizione di varianza
Esercitazione
3
A. Iodice
La variabilità
variabilità per
variabili
qualitative
La varianza un’indice che misura la variabilità di una variabile
X rispetto alla media aritmetica. In particolare la varianza σ 2
data dalla media dei quadrati degli scarti (delle modalità dalla
media)
(x1 − µ)2 + (x2 − µ)2 + . . . + (xn − µ)2
=
n
n
1X
=
(xi − µ)2
n
σ2 =
Indici di
eterogeneità
La varianza
Altri indici di
variabilità
i=1
Mutua
variabilità
Esercizio sulla
variabilità
A. Iodice ()
Esercitazione 3
Statistica
13 / 31
Definizione di varianza
Esercitazione
3
A. Iodice
La variabilità
variabilità per
variabili
qualitative
La varianza un’indice che misura la variabilità di una variabile
X rispetto alla media aritmetica. In particolare la varianza σ 2
data dalla media dei quadrati degli scarti (delle modalità dalla
media)
(x1 − µ)2 + (x2 − µ)2 + . . . + (xn − µ)2
=
n
n
1X
=
(xi − µ)2
n
σ2 =
Indici di
eterogeneità
La varianza
Altri indici di
variabilità
Mutua
variabilità
Esercizio sulla
variabilità
i=1
per dati organizzati in frequenze (seriazione)
(x1 − µ)2 × n1 + (x2 − µ)2 × n2 + . . . + (xk − µ)2 × nk
=
n1 + n2 + . . . + nk
k
1X
=
(xi − µ)2 × ni
n
σ2 =
i=1
A. Iodice ()
Esercitazione 3
Statistica
13 / 31
Esempio di calcolo della varianza
Esercitazione
3
A. Iodice
Data la variabile X : numero di esami sostenuti prima di quello
di statistica osservata su un collettivo di n = 6 studenti
La variabilità
variabilità per
variabili
qualitative
Indici di
eterogeneità
La varianza
Altri indici di
variabilità
Mutua
variabilità
Esercizio sulla
variabilità
A. Iodice ()
Esercitazione 3
Statistica
14 / 31
Esempio di calcolo della varianza
Esercitazione
3
A. Iodice
Data la variabile X : numero di esami sostenuti prima di quello
di statistica osservata su un collettivo di n = 6 studenti
La variabilità
variabilità per
variabili
qualitative
Indici di
eterogeneità
La varianza
Altri indici di
variabilità
Mutua
variabilità
Esercizio sulla
variabilità
A. Iodice ()
Esercitazione 3
Statistica
14 / 31
Esempio di calcolo della varianza
Esercitazione
3
A. Iodice
Data la variabile X : numero di esami sostenuti prima di quello
di statistica osservata su un collettivo di n = 6 studenti
La variabilità
variabilità per
variabili
qualitative
Indici di
eterogeneità
La varianza
Altri indici di
variabilità
Mutua
variabilità
Esercizio sulla
variabilità
La varianza sar dunque
n
1X
50.8333
2
σ =
(xi − µ)2 =
= 8.4722
n
6
i=1
A. Iodice ()
Esercitazione 3
Statistica
14 / 31
Massima variabilità
Esercitazione
3
A. Iodice
La variabilità
variabilità per
variabili
qualitative
Indici di
eterogeneità
La varianza
Altri indici di
variabilità
Mutua
variabilità
Esercizio sulla
variabilità
A. Iodice ()
Esercitazione 3
Statistica
15 / 31
Massima variabilità
Esercitazione
3
La varianza può crescere indefinitamente perchè gli scarti
delle modalità dalla media possono essere illimitatamente
grandi
A. Iodice
La variabilità
variabilità per
variabili
qualitative
Indici di
eterogeneità
La varianza
Altri indici di
variabilità
Mutua
variabilità
Esercizio sulla
variabilità
A. Iodice ()
Esercitazione 3
Statistica
15 / 31
Massima variabilità
Esercitazione
3
La varianza può crescere indefinitamente perchè gli scarti
delle modalità dalla media possono essere illimitatamente
grandi
La situazione di massima variabilità per un collettivo con
media µ, si ha quando su n modalità, n − 1 sono nulle ed
0
una sola modalità x6=
i = nµ
A. Iodice
La variabilità
variabilità per
variabili
qualitative
Indici di
eterogeneità
n
σ2 ≤
La varianza
Altri indici di
variabilità
1X
1
(xi − µ)2 = ((n − 1)(0 − µ)2 + (nµ − µ)2 ) =
n
n
i=1
1
= ((n − 1)µ2 + µ2 (n − 1)2 ) =
n
1
= ((n − 1)µ2 + µ2 (n2 + 1 − 2n)) =
n
1
= (µ2 n(n − 1)) = µ2 (n − 1)
n
Mutua
variabilità
Esercizio sulla
variabilità
A. Iodice ()
Esercitazione 3
Statistica
15 / 31
Le proprietà della varianza
Esercitazione
3
A. Iodice
La variabilità
variabilità per
variabili
qualitative
La varianza gode di alcune importanti propriet di seguito
riportate:
Indici di
eterogeneità
La varianza
Altri indici di
variabilità
Mutua
variabilità
Esercizio sulla
variabilità
A. Iodice ()
Esercitazione 3
Statistica
16 / 31
Le proprietà della varianza
Esercitazione
3
A. Iodice
La variabilità
variabilità per
variabili
qualitative
Indici di
eterogeneità
La varianza
La varianza gode di alcune importanti propriet di seguito
riportate:
1
La varianza di X sempre un numero non negativo (≥ 0)
2
La varianza di X pari a 0 se e solo se X una costante
3
Se alla variabile X si aggiunge una costante, σx non
cambia
4
Se si moltiplica la variabile X per una costante b, si avr
σx∗ = b2 σx2
Altri indici di
variabilità
Mutua
variabilità
Esercizio sulla
variabilità
A. Iodice ()
Esercitazione 3
Statistica
16 / 31
Le proprietà della varianza
Esercitazione
3
A. Iodice
La variabilità
variabilità per
variabili
qualitative
Indici di
eterogeneità
La varianza
Altri indici di
variabilità
Mutua
variabilità
Esercizio sulla
variabilità
Le propriet 3 e 4 dipendono dalla propriet di linearit della media
aritmetica: si consideri Y = a + bX, con a e b costanti. Dalla
propriet risulta che µy = a + bµx . Calcolando la varianza di Y
si avr:
n
σy2
1X
(yi − µy )2 =
=
n
1=1
n
n
1X
1X
2
=
(yi − (a + bµx )) =
(a + bxi − a − bµx )2 =
n
n
1=1
1=1
n
n
1X 2
1X
2
(bxi − bµx ) =
b (xi − µx )2 =
=
n
n
= b2
A. Iodice ()
1=1
n
X
1
n
1=1
(xi − µx )2 = b2 σx2
i=1
Esercitazione 3
Statistica
17 / 31
Lo scarto quadratico medio (standard deviation)
Esercitazione
3
A. Iodice
La variabilità
variabilità per
variabili
qualitative
Una difficoltà di interpretazione della varianza dipende dal fatto
che tale indice espresso nell’unità di misura al quadrato della
variabile cui si riferisce. Per ovviare a questo problema si
utilizza lo scarto quadratico medio σ, dato da
Indici di
eterogeneità
La varianza
Altri indici di
variabilità
Mutua
variabilità
Esercizio sulla
variabilità
A. Iodice ()
Esercitazione 3
Statistica
18 / 31
Lo scarto quadratico medio (standard deviation)
Esercitazione
3
A. Iodice
La variabilità
variabilità per
variabili
qualitative
Indici di
eterogeneità
La varianza
Una difficoltà di interpretazione della varianza dipende dal fatto
che tale indice espresso nell’unità di misura al quadrato della
variabile cui si riferisce. Per ovviare a questo problema si
utilizza lo scarto quadratico medio σ, dato da
v
u n
u1 X
σ=t
(xi − µ)2
n
i=1
Altri indici di
variabilità
Mutua
variabilità
Esercizio sulla
variabilità
A. Iodice ()
Esercitazione 3
Statistica
18 / 31
Lo scarto quadratico medio (standard deviation)
Esercitazione
3
A. Iodice
La variabilità
variabilità per
variabili
qualitative
Indici di
eterogeneità
La varianza
Una difficoltà di interpretazione della varianza dipende dal fatto
che tale indice espresso nell’unità di misura al quadrato della
variabile cui si riferisce. Per ovviare a questo problema si
utilizza lo scarto quadratico medio σ, dato da
v
u n
u1 X
σ=t
(xi − µ)2
n
i=1
Altri indici di
variabilità
Mutua
variabilità
Esercizio sulla
variabilità
dall’esempio precedente risulta dunque
r
50.8333
σ=
= 2.9107
6
A. Iodice ()
Esercitazione 3
Statistica
18 / 31
Il coefficiente di variazione (CV
Esercitazione
3
A. Iodice
La variabilità
variabilità per
variabili
qualitative
La varianza è un indice assoluto, dipende quindi dall’unità di
misura della variabile. Un indice relativo di variabilità è il
coefficiente di variazione CV . E’ dato da
CV =
Indici di
eterogeneità
La varianza
Altri indici di
variabilità
σ
µ
essendo un numero puro consente il confronto fra fenomeni
rilevati in momenti diversi o espressi in unità di misura diverse
Mutua
variabilità
Esercizio sulla
variabilità
A. Iodice ()
Esercitazione 3
Statistica
19 / 31
Il coefficiente di variazione (CV
Esercitazione
3
A. Iodice
La variabilità
variabilità per
variabili
qualitative
La varianza è un indice assoluto, dipende quindi dall’unità di
misura della variabile. Un indice relativo di variabilità è il
coefficiente di variazione CV . E’ dato da
CV =
Indici di
eterogeneità
La varianza
Altri indici di
variabilità
Mutua
variabilità
Esercizio sulla
variabilità
σ
µ
essendo un numero puro consente il confronto fra fenomeni
rilevati in momenti diversi o espressi in unità di misura diverse
Limiti di utilizzo del CV
è defnito solo se µ > 0
se µ → 0 il CV tende a diventare molto grande
A. Iodice ()
Esercitazione 3
Statistica
19 / 31
Variabilità e modalità ordinate
Esercitazione
3
A. Iodice
La variabilità
variabilità per
variabili
qualitative
In caso di variabili con modalità ordinabili è possibile definire
degli indici di variabilità derivati dalla funzione di ripartizione
empirica. Data la distribuzione unitaria ordinata di modalità
Indici di
eterogeneità
{1, 5, 7, 13, 14, 15, 18, 18, 22, 23, 24, 25, 27, 28, 29}
La varianza
Altri indici di
variabilità
Mutua
variabilità
Esercizio sulla
variabilità
A. Iodice ()
Esercitazione 3
Statistica
20 / 31
Variabilità e modalità ordinate
Esercitazione
3
A. Iodice
La variabilità
variabilità per
variabili
qualitative
In caso di variabili con modalità ordinabili è possibile definire
degli indici di variabilità derivati dalla funzione di ripartizione
empirica. Data la distribuzione unitaria ordinata di modalità
Indici di
eterogeneità
{1, 5, 7, 13, 14, 15, 18, 18, 22, 23, 24, 25, 27, 28, 29}
La varianza
Altri indici di
variabilità
il range (o campo di variazione) è dato da
R(X) = max(xi ) − min(xi = 29 − 1 = 27
Mutua
variabilità
il range inter-quartile (o campo di variazione interquartile)
è dato da IQR(X) = Q3 − Q1 = 25 − 13 = 12
Esercizio sulla
variabilità
A. Iodice ()
Esercitazione 3
Statistica
20 / 31
Variabilità e modalità ordinate
Esercitazione
3
A. Iodice
La variabilità
variabilità per
variabili
qualitative
In caso di variabili con modalità ordinabili è possibile definire
degli indici di variabilità derivati dalla funzione di ripartizione
empirica. Data la distribuzione unitaria ordinata di modalità
Indici di
eterogeneità
{1, 5, 7, 13, 14, 15, 18, 18, 22, 23, 24, 25, 27, 28, 29}
La varianza
Altri indici di
variabilità
il range (o campo di variazione) è dato da
R(X) = max(xi ) − min(xi = 29 − 1 = 27
Mutua
variabilità
il range inter-quartile (o campo di variazione interquartile)
è dato da IQR(X) = Q3 − Q1 = 25 − 13 = 12
Esercizio sulla
variabilità
A. Iodice ()
Esercitazione 3
Statistica
20 / 31
Mutua variabilità
Esercitazione
3
A. Iodice
La variabilità
variabilità per
variabili
qualitative
In presenza di caratteri trasferibili (reddito, risorde energetiche,
consumo di beni) è di maggior interesse lo studio della
variabilità tra le singole unità statistiche piuttosto che la
variabilità rispetto a un centro.
Indici di
eterogeneità
La varianza
Altri indici di
variabilità
Mutua
variabilità
Esercizio sulla
variabilità
A. Iodice ()
Esercitazione 3
Statistica
21 / 31
Mutua variabilità
Esercitazione
3
A. Iodice
La variabilità
variabilità per
variabili
qualitative
Indici di
eterogeneità
La varianza
Altri indici di
variabilità
Mutua
variabilità
Esercizio sulla
variabilità
In presenza di caratteri trasferibili (reddito, risorde energetiche,
consumo di beni) è di maggior interesse lo studio della
variabilità tra le singole unità statistiche piuttosto che la
variabilità rispetto a un centro.
Differenza media semplice
tale indice rappresenta la media dei valori assoluti delle
differenze calcolate rispetto a tutte le possibili coppie di
modalità. Esso corrisponde a
Pn
i6=j=1 |xi − xj |
∆=
n(n − 1)
la quantità al denominatore (n(n − 1)) rappresenta il numero
di possibili coppie di n osservazioni.
A. Iodice ()
Esercitazione 3
Statistica
21 / 31
Mutua variabilità
Esercitazione
3
Dato un carattere X osservato su n = 4 osservazioni
A. Iodice
{7, 14, 18, 24}
La variabilità
variabilità per
variabili
qualitative
Indici di
eterogeneità
La varianza
Altri indici di
variabilità
Mutua
variabilità
Esercizio sulla
variabilità
A. Iodice ()
Esercitazione 3
Statistica
22 / 31
Mutua variabilità
Esercitazione
3
Dato un carattere X osservato su n = 4 osservazioni
A. Iodice
{7, 14, 18, 24}
La variabilità
variabilità per
variabili
qualitative
Indici di
eterogeneità
La varianza
Altri indici di
variabilità
Mutua
variabilità
Esercizio sulla
variabilità
Differenza media semplice
Il valore di ∆ sarà in questo caso
|7 − 14| + |7 − 18| + |7 − 24| + |14 − 7|+
12
+|14 − 18| + |14 − 24| + |18 − 7| + |18 − 14| + |18 − 24|+
12
+|24 − 7| + |24 − 14| + |24 − 18|
=
12
110
=
= 9.1667
12
∆=
A. Iodice ()
Esercitazione 3
Statistica
22 / 31
mutua variabilità: minimo e massimo
Esercitazione
3
l’indice ∆ assume il valore minimo (∆ = 0) quando tutte
le modalità coincidono: in questo caso le differenze
semplici sono nulle
A. Iodice
La variabilità
variabilità per
variabili
qualitative
l’indice ∆ assume il valore massimo quando tutte le
modalità tranne una sono nulle: in tal caso si ha che
∆ = 2µ
Indici di
eterogeneità
La varianza
Altri indici di
variabilità
Mutua
variabilità
Dunque ∆ assume valore nell’intervallo [0, 2µ]: è possibile
ottenere una versione normalizzata:
Esercizio sulla
variabilità
R=
∆
2µ
tale indice viene denominato rapporto di concentrazione di Gini
A. Iodice ()
Esercitazione 3
Statistica
23 / 31
Esercizio
Esercitazione
3
Si consideri un campione di n = 100 sportelli bancari e sia X : numero di
operazioni effettuate presso uno sportello nell’ultima settimana.
A. Iodice
X
[60, 62]
[63, 65]
[66, 68]
[69, 71]
[72, 74]
La variabilità
variabilità per
variabili
qualitative
Indici di
eterogeneità
La varianza
Freq (ni )
5
18
42
27
8
100
Altri indici di
variabilità
Mutua
variabilità
Quesiti
Calcolare un indice di tendenza centrale (media)
Esercizio sulla
variabilità
Misurare la variabilità rispetto ad un centro (scostamento medio
semplice e scarto quadratico medio)
Misurare la mutua variabilità
A. Iodice ()
Esercitazione 3
Statistica
24 / 31
Esercizio: svolgimento
Esercitazione
3
Quesito 1
Calcolare un indice di tendenza centrale (media)
A. Iodice
La variabilità
variabilità per
variabili
qualitative
Calcolo della media aritmetica
Per calcolare la media aritmetica bisogna individuare i centri di ciascuna classe e tenere conto delle
frequenze. Ricordando la formula della media aritmetica
Indici di
eterogeneità
Pk
µ=
i=1
ci × ni
n
La varianza
Altri indici di
variabilità
X
[60, 62]
[63, 65]
[66, 68]
[69, 71]
[72, 74]
Mutua
variabilità
Esercizio sulla
variabilità
Pk
µ=
A. Iodice ()
i=1
Freq=ni
5
18
42
27
8
100
ci × ni
n
=
centri=ci
61
64
67
70
73
ci × ni
305
1152
2814
1890
584
6745
305 + 1152 + 2814 + 1890 + 584
Esercitazione 3
100
= 67.45
Statistica
25 / 31
Esercizio: svolgimento
Esercitazione
3
Quesito 2
Misurare la variabilità rispetto ad un centro : scostamento medio semplice
A. Iodice
La variabilità
Calcolo dello scostamento medio semplice
variabilità per
variabili
qualitative
Per ottenere lo scostamento medio semplice bisogna calcolare il valore assoluto degli scarti dei centri delle
classi dalla media e tenere conto delle frequenze. Ricordando la formula dello scostamento medio semplice
Pk
Indici di
eterogeneità
MD =
i=1
| ci − µ | ×ni
n
La varianza
Altri indici di
variabilità
X
[60, 62]
[63, 65]
[66, 68]
[69, 71]
[72, 74]
Mutua
variabilità
Esercizio sulla
variabilità
Pk
MD =
A. Iodice ()
i=1
Freq=ni
5
18
42
27
8
100
| ci − µ | ×ni
n
=
centri=ci
61
64
67
70
73
| ci − µ |
6.45
3.45
0.45
2.55
5.55
| ci − µ | ×ni
32.25
62.10
18.90
68.85
44.40
226.5
32.25 + 62.1 + 18.9 + 68.85 + 44.4
Esercitazione 3
100
=
226.5
100
= 2.265
Statistica
26 / 31
Esercizio: svolgimento
Esercitazione
3
Quesito 2
Misurare la variabilità rispetto ad un centro : scarto quadratico medio
A. Iodice
La variabilità
Calcolo della varianza
variabilità per
variabili
qualitative
Per ottenere lo scarto quadratico medio, si procede al calcolo della varianza che rappresenta il valore medio
dei quadrati degli scarti dalla media aritmetica: bisogna calcolare i quadrati degli scarti dei centri delle classi
dalla media e tenere conto delle frequenze. Ricordando la formula della varianza
Pk
2
2
i=1 (ci − µ) × ni
s =
n
Indici di
eterogeneità
La varianza
Altri indici di
variabilità
X
[60, 62]
[63, 65]
[66, 68]
[69, 71]
[72, 74]
Mutua
variabilità
Esercizio sulla
variabilità
2
s
=
Freq=ni
5
18
42
27
8
centri=ci
61
64
67
70
73
100
(ci − µ)2
41.60
11.90
0.20
6.50
30.80
(ci − µ)2 × ni
208.0125
214.245
8.505
175.5675
246.42
852.75
208.0125 + 214.245 + 8.505 + 175.5675 + 246.42
100
=
852.75
100
= 8.5275
√
da cui lo scarto quadratico medio s = 8.5275 = 2.92
A. Iodice ()
Esercitazione 3
Statistica
27 / 31
Esercizio: svolgimento
Esercitazione
3
Quesito 2
Misurare la variabilità rispetto ad un centro : scarto quadratico medio
A. Iodice
La variabilità
Calcolo della varianza
variabilità per
variabili
qualitative
Ripetendo il calcolo utilizzando la formula alternativa per il calcolo della varianza
s
Indici di
eterogeneità
2
Pk
=
i=1
c2
i × ni
N
Pk
i=1
−
ci × ni
!2
N
Pk
i=1
=
c2
i × ni
N
2
− (µ)
La varianza
Altri indici di
variabilità
X
[60, 62]
[63, 65]
[66, 68]
[69, 71]
[72, 74]
Mutua
variabilità
Esercizio sulla
variabilità
s
2
Pk
=
i=1
c2
i × ni
N
Freq=ni
5
18
42
27
8
100
Pk
−
i=1
ci
N
da cui lo scarto quadratico medio s =
A. Iodice ()
!2
=
centri=ci
61
64
67
70
73
455803
100
−
c2
i
3721
4096
4489
4900
5329
6745
100
c2
i × ni
18605
73728
188538
132300
42632
455803
2
= 4558.03 − 4549.503 = 8.5275
√
8.5275 = 2.92
Esercitazione 3
Statistica
28 / 31
Esercizio: svolgimento
Esercitazione
3
A. Iodice
Quesito 3
Misurare la mutua variabilità : differenza media semplice
La variabilità
variabilità per
variabili
qualitative
Calcolo della mutua variabilità
La differenza media semplice corrisponde al valore medio delle differenze tra le possibili coppie di modalità.
Indici di
eterogeneità
PN
∆=
La varianza
Altri indici di
variabilità
Mutua
variabilità
i6=j=1
|xi − xj |
N (N − 1)
la quantità al denominatore (N (N − 1)) rappresenta il numero di possibili coppie di n osservazioni.
Nel caso di intervalli di valori e di distribuzione di frequenze si fa riferimento ai centri delle classi ci e alle
frequenze. La formula da utilizzare è la seguente
Pk
Esercizio sulla
variabilità
∆=
A. Iodice ()
i6=j=1
|xi − xj | × ni × nj
N (N − 1)
Esercitazione 3
Statistica
29 / 31
Esercizio: svolgimento
Esercitazione
3
Quesito 3
Misurare la mutua variabilità : differenza media semplice
A. Iodice
La variabilità
variabilità per
variabili
qualitative
Indici di
eterogeneità
La varianza
Altri indici di
variabilità
Mutua
variabilità
X
[60, 62]
[63, 65]
[66, 68]
[69, 71]
[72, 74]
Esercizio sulla
variabilità
A. Iodice ()
Freq=ni
5
18
42
27
8
100
centri=ci
61
64
67
70
73
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Esercitazione 3
| ci − cj |
3
6
9
12
3
3
6
9
6
3
3
6
9
6
3
3
12
9
6
3
ni × nj
90
210
135
40
90
756
486
144
210
756
1134
336
135
486
1134
216
40
144
336
216
| ci − cj | ×ni × nj
270
1260
1215
480
270
2268
2916
1296
1260
2268
3402
2016
1215
2916
3402
648
480
1296
2016
648
31542
Statistica
30 / 31
Esercizio: svolgimento
Esercitazione
3
Quesito 3
A. Iodice
Misurare la mutua variabilità : differenza media semplice metodo rapido.
La variabilità
variabilità per
variabili
qualitative
Indici di
eterogeneità
La varianza
ci /cj
61
64
67
70
73
61
25
90
210
135
40
64
90
324
756
486
144
67
210
756
1764
1134
336
70
135
486
1134
729
216
ci − cj
3
6
9
12
3
6
9
3
6
3
73
40
144
336
216
64
Altri indici di
variabilità
ni × nj
90
210
135
40
756
486
144
1134
336
216
Mutua
variabilità
Esercizio sulla
variabilità
2×
∆=
=
A. Iodice ()
Pk−1 Pk
i=1
j=(i+1)
|xi − xj | × ni × nj
N (N − 1)
=
(3 × 90) + (6 × 210) + (9 × 135) + . . . + (3 × 216)
100 × 99
Esercitazione 3
= 3.186
Statistica
31 / 31