Esercitazione
4
A. Iodice
La varianza
Esercitazione 4
Altri indici di
variabilità
Statistica
Mutua
variabilità
Esercizio sulla
variabilità
Alfonso Iodice D’Enza
[email protected]
Università degli studi di Cassino
A. Iodice ()
Esercitazione 4
Statistica
1 / 21
Outline
Esercitazione
4
A. Iodice
La varianza
1
La varianza
2
Altri indici di variabilità
3
Mutua variabilità
4
Esercizio sulla variabilità
Altri indici di
variabilità
Mutua
variabilità
Esercizio sulla
variabilità
A. Iodice ()
Esercitazione 4
Statistica
2 / 21
Definizione di varianza
Esercitazione
4
A. Iodice
La varianza
Altri indici di
variabilità
La varianza un’indice che misura la variabilità di una variabile
X rispetto alla media aritmetica. In particolare la varianza σ 2
data dalla media dei quadrati degli scarti (delle modalità dalla
media)
Mutua
variabilità
Esercizio sulla
variabilità
A. Iodice ()
Esercitazione 4
Statistica
3 / 21
Definizione di varianza
Esercitazione
4
A. Iodice
La varianza
Altri indici di
variabilità
La varianza un’indice che misura la variabilità di una variabile
X rispetto alla media aritmetica. In particolare la varianza σ 2
data dalla media dei quadrati degli scarti (delle modalità dalla
media)
(x1 − µ)2 + (x2 − µ)2 + . . . + (xn − µ)2
=
n
n
1X
=
(xi − µ)2
n
σ2 =
Mutua
variabilità
Esercizio sulla
variabilità
i=1
A. Iodice ()
Esercitazione 4
Statistica
3 / 21
Definizione di varianza
Esercitazione
4
A. Iodice
La varianza
Altri indici di
variabilità
La varianza un’indice che misura la variabilità di una variabile
X rispetto alla media aritmetica. In particolare la varianza σ 2
data dalla media dei quadrati degli scarti (delle modalità dalla
media)
(x1 − µ)2 + (x2 − µ)2 + . . . + (xn − µ)2
=
n
n
1X
=
(xi − µ)2
n
σ2 =
Mutua
variabilità
Esercizio sulla
variabilità
i=1
per dati organizzati in frequenze (seriazione)
(x1 − µ)2 × n1 + (x2 − µ)2 × n2 + . . . + (xk − µ)2 × nk
=
n1 + n2 + . . . + nk
k
1X
=
(xi − µ)2 × ni
n
σ2 =
i=1
A. Iodice ()
Esercitazione 4
Statistica
3 / 21
Esempio di calcolo della varianza
Esercitazione
4
A. Iodice
Data la variabile X : numero di esami sostenuti prima di quello
di statistica osservata su un collettivo di n = 6 studenti
La varianza
Altri indici di
variabilità
Mutua
variabilità
Esercizio sulla
variabilità
A. Iodice ()
Esercitazione 4
Statistica
4 / 21
Esempio di calcolo della varianza
Esercitazione
4
A. Iodice
Data la variabile X : numero di esami sostenuti prima di quello
di statistica osservata su un collettivo di n = 6 studenti
La varianza
Altri indici di
variabilità
Mutua
variabilità
Esercizio sulla
variabilità
A. Iodice ()
Esercitazione 4
Statistica
4 / 21
Esempio di calcolo della varianza
Esercitazione
4
A. Iodice
Data la variabile X : numero di esami sostenuti prima di quello
di statistica osservata su un collettivo di n = 6 studenti
La varianza
Altri indici di
variabilità
Mutua
variabilità
Esercizio sulla
variabilità
La varianza sar dunque
n
1X
50.8333
2
σ =
(xi − µ)2 =
= 8.4722
n
6
i=1
A. Iodice ()
Esercitazione 4
Statistica
4 / 21
Massima variabilità
Esercitazione
4
A. Iodice
La varianza
Altri indici di
variabilità
Mutua
variabilità
Esercizio sulla
variabilità
A. Iodice ()
Esercitazione 4
Statistica
5 / 21
Massima variabilità
Esercitazione
4
La varianza può crescere indefinitamente perchè gli scarti
delle modalità dalla media possono essere illimitatamente
grandi
A. Iodice
La varianza
Altri indici di
variabilità
Mutua
variabilità
Esercizio sulla
variabilità
A. Iodice ()
Esercitazione 4
Statistica
5 / 21
Massima variabilità
Esercitazione
4
La varianza può crescere indefinitamente perchè gli scarti
delle modalità dalla media possono essere illimitatamente
grandi
La situazione di massima variabilità per un collettivo con
media µ, si ha quando su n modalità, n − 1 sono nulle ed
0
una sola modalità x6=
i = nµ
A. Iodice
La varianza
Altri indici di
variabilità
Mutua
variabilità
n
Esercizio sulla
variabilità
σ2 ≤
1X
1
(xi − µ)2 = ((n − 1)(0 − µ)2 + (nµ − µ)2 ) =
n
n
i=1
1
= ((n − 1)µ2 + µ2 (n − 1)2 ) =
n
1
= ((n − 1)µ2 + µ2 (n2 + 1 − 2n)) =
n
1
= (µ2 n(n − 1)) = µ2 (n − 1)
n
A. Iodice ()
Esercitazione 4
Statistica
5 / 21
Le proprietà della varianza
Esercitazione
4
A. Iodice
La varianza
Altri indici di
variabilità
La varianza gode di alcune importanti propriet di seguito
riportate:
Mutua
variabilità
Esercizio sulla
variabilità
A. Iodice ()
Esercitazione 4
Statistica
6 / 21
Le proprietà della varianza
Esercitazione
4
A. Iodice
La varianza
Altri indici di
variabilità
Mutua
variabilità
Esercizio sulla
variabilità
La varianza gode di alcune importanti propriet di seguito
riportate:
1
La varianza di X sempre un numero non negativo (≥ 0)
2
La varianza di X pari a 0 se e solo se X una costante
3
Se alla variabile X si aggiunge una costante, σx non
cambia
4
Se si moltiplica la variabile X per una costante b, si avr
σx∗ = b2 σx2
A. Iodice ()
Esercitazione 4
Statistica
6 / 21
Le proprietà della varianza
Esercitazione
4
A. Iodice
La varianza
Altri indici di
variabilità
Mutua
variabilità
Esercizio sulla
variabilità
Le propriet 3 e 4 dipendono dalla propriet di linearit della media
aritmetica: si consideri Y = a + bX, con a e b costanti. Dalla
propriet risulta che µy = a + bµx . Calcolando la varianza di Y
si avr:
n
σy2
1X
(yi − µy )2 =
=
n
1=1
n
n
1X
1X
2
=
(yi − (a + bµx )) =
(a + bxi − a − bµx )2 =
n
n
1=1
1=1
n
n
1X 2
1X
2
(bxi − bµx ) =
b (xi − µx )2 =
=
n
n
= b2
A. Iodice ()
1=1
n
X
1
n
1=1
(xi − µx )2 = b2 σx2
i=1
Esercitazione 4
Statistica
7 / 21
Lo scarto quadratico medio (standard deviation)
Esercitazione
4
A. Iodice
La varianza
Altri indici di
variabilità
Una difficoltà di interpretazione della varianza dipende dal fatto
che tale indice espresso nell’unità di misura al quadrato della
variabile cui si riferisce. Per ovviare a questo problema si
utilizza lo scarto quadratico medio σ, dato da
Mutua
variabilità
Esercizio sulla
variabilità
A. Iodice ()
Esercitazione 4
Statistica
8 / 21
Lo scarto quadratico medio (standard deviation)
Esercitazione
4
A. Iodice
La varianza
Altri indici di
variabilità
Mutua
variabilità
Esercizio sulla
variabilità
Una difficoltà di interpretazione della varianza dipende dal fatto
che tale indice espresso nell’unità di misura al quadrato della
variabile cui si riferisce. Per ovviare a questo problema si
utilizza lo scarto quadratico medio σ, dato da
v
u n
u1 X
σ=t
(xi − µ)2
n
i=1
A. Iodice ()
Esercitazione 4
Statistica
8 / 21
Lo scarto quadratico medio (standard deviation)
Esercitazione
4
A. Iodice
La varianza
Altri indici di
variabilità
Mutua
variabilità
Esercizio sulla
variabilità
Una difficoltà di interpretazione della varianza dipende dal fatto
che tale indice espresso nell’unità di misura al quadrato della
variabile cui si riferisce. Per ovviare a questo problema si
utilizza lo scarto quadratico medio σ, dato da
v
u n
u1 X
σ=t
(xi − µ)2
n
i=1
dall’esempio precedente risulta dunque
r
50.8333
σ=
= 2.9107
6
A. Iodice ()
Esercitazione 4
Statistica
8 / 21
Il coefficiente di variazione (CV
Esercitazione
4
A. Iodice
La varianza
Altri indici di
variabilità
La varianza è un indice assoluto, dipende quindi dall’unità di
misura della variabile. Un indice relativo di variabilità è il
coefficiente di variazione CV . E’ dato da
CV =
Mutua
variabilità
Esercizio sulla
variabilità
σ
µ
essendo un numero puro consente il confronto fra fenomeni
rilevati in momenti diversi o espressi in unità di misura diverse
A. Iodice ()
Esercitazione 4
Statistica
9 / 21
Il coefficiente di variazione (CV
Esercitazione
4
A. Iodice
La varianza
Altri indici di
variabilità
La varianza è un indice assoluto, dipende quindi dall’unità di
misura della variabile. Un indice relativo di variabilità è il
coefficiente di variazione CV . E’ dato da
CV =
Mutua
variabilità
Esercizio sulla
variabilità
σ
µ
essendo un numero puro consente il confronto fra fenomeni
rilevati in momenti diversi o espressi in unità di misura diverse
Limiti di utilizzo del CV
è defnito solo se µ > 0
se µ → 0 il CV tende a diventare molto grande
A. Iodice ()
Esercitazione 4
Statistica
9 / 21
Variabilità e modalità ordinate
Esercitazione
4
A. Iodice
La varianza
Altri indici di
variabilità
In caso di variabili con modalità ordinabili è possibile definire
degli indici di variabilità derivati dalla funzione di ripartizione
empirica. Data la distribuzione unitaria ordinata di modalità
Mutua
variabilità
{1, 5, 7, 13, 14, 15, 18, 18, 22, 23, 24, 25, 27, 28, 29}
Esercizio sulla
variabilità
A. Iodice ()
Esercitazione 4
Statistica
10 / 21
Variabilità e modalità ordinate
Esercitazione
4
A. Iodice
La varianza
Altri indici di
variabilità
In caso di variabili con modalità ordinabili è possibile definire
degli indici di variabilità derivati dalla funzione di ripartizione
empirica. Data la distribuzione unitaria ordinata di modalità
Mutua
variabilità
{1, 5, 7, 13, 14, 15, 18, 18, 22, 23, 24, 25, 27, 28, 29}
Esercizio sulla
variabilità
il range (o campo di variazione) è dato da
R(X) = max(xi ) − min(xi = 29 − 1 = 27
il range inter-quartile (o campo di variazione interquartile)
è dato da IQR(X) = Q3 − Q1 = 25 − 13 = 12
A. Iodice ()
Esercitazione 4
Statistica
10 / 21
Variabilità e modalità ordinate
Esercitazione
4
A. Iodice
La varianza
Altri indici di
variabilità
In caso di variabili con modalità ordinabili è possibile definire
degli indici di variabilità derivati dalla funzione di ripartizione
empirica. Data la distribuzione unitaria ordinata di modalità
Mutua
variabilità
{1, 5, 7, 13, 14, 15, 18, 18, 22, 23, 24, 25, 27, 28, 29}
Esercizio sulla
variabilità
il range (o campo di variazione) è dato da
R(X) = max(xi ) − min(xi = 29 − 1 = 27
il range inter-quartile (o campo di variazione interquartile)
è dato da IQR(X) = Q3 − Q1 = 25 − 13 = 12
A. Iodice ()
Esercitazione 4
Statistica
10 / 21
Mutua variabilità
Esercitazione
4
A. Iodice
La varianza
Altri indici di
variabilità
In presenza di caratteri trasferibili (reddito, risorde energetiche,
consumo di beni) è di maggior interesse lo studio della
variabilità tra le singole unità statistiche piuttosto che la
variabilità rispetto a un centro.
Mutua
variabilità
Esercizio sulla
variabilità
A. Iodice ()
Esercitazione 4
Statistica
11 / 21
Mutua variabilità
Esercitazione
4
A. Iodice
La varianza
Altri indici di
variabilità
Mutua
variabilità
Esercizio sulla
variabilità
In presenza di caratteri trasferibili (reddito, risorde energetiche,
consumo di beni) è di maggior interesse lo studio della
variabilità tra le singole unità statistiche piuttosto che la
variabilità rispetto a un centro.
Differenza media semplice
tale indice rappresenta la media dei valori assoluti delle
differenze calcolate rispetto a tutte le possibili coppie di
modalità. Esso corrisponde a
Pn
i6=j=1 |xi − xj |
∆=
n(n − 1)
la quantità al denominatore (n(n − 1)) rappresenta il numero
di possibili coppie di n osservazioni.
A. Iodice ()
Esercitazione 4
Statistica
11 / 21
Mutua variabilità
Esercitazione
4
Dato un carattere X osservato su n = 4 osservazioni
A. Iodice
{7, 14, 18, 24}
La varianza
Altri indici di
variabilità
Mutua
variabilità
Esercizio sulla
variabilità
A. Iodice ()
Esercitazione 4
Statistica
12 / 21
Mutua variabilità
Esercitazione
4
Dato un carattere X osservato su n = 4 osservazioni
A. Iodice
{7, 14, 18, 24}
La varianza
Altri indici di
variabilità
Mutua
variabilità
Esercizio sulla
variabilità
Differenza media semplice
Il valore di ∆ sarà in questo caso
|7 − 14| + |7 − 18| + |7 − 24| + |14 − 7|+
12
+|14 − 18| + |14 − 24| + |18 − 7| + |18 − 14| + |18 − 24|+
12
+|24 − 7| + |24 − 14| + |24 − 18|
=
12
110
=
= 9.1667
12
∆=
A. Iodice ()
Esercitazione 4
Statistica
12 / 21
mutua variabilità: minimo e massimo
Esercitazione
4
l’indice ∆ assume il valore minimo (∆ = 0) quando tutte
le modalità coincidono: in questo caso le differenze
semplici sono nulle
A. Iodice
La varianza
Altri indici di
variabilità
l’indice ∆ assume il valore massimo quando tutte le
modalità tranne una sono nulle: in tal caso si ha che
∆ = 2µ
Mutua
variabilità
Esercizio sulla
variabilità
Dunque ∆ assume valore nell’intervallo [0, 2µ]: è possibile
ottenere una versione normalizzata:
R=
∆
2µ
tale indice viene denominato rapporto di concentrazione di Gini
A. Iodice ()
Esercitazione 4
Statistica
13 / 21
Esercizio
Esercitazione
4
Si consideri un campione di n = 100 sportelli bancari e sia X : numero di
operazioni effettuate presso uno sportello nell’ultima settimana.
A. Iodice
X
[60, 62]
[63, 65]
[66, 68]
[69, 71]
[72, 74]
La varianza
Altri indici di
variabilità
Mutua
variabilità
Esercizio sulla
variabilità
Freq (ni )
5
18
42
27
8
100
Quesiti
Calcolare un indice di tendenza centrale (media)
Misurare la variabilità rispetto ad un centro (scostamento medio
semplice e scarto quadratico medio)
Misurare la mutua variabilità
A. Iodice ()
Esercitazione 4
Statistica
14 / 21
Esercizio: svolgimento
Esercitazione
4
Quesito 1
Calcolare un indice di tendenza centrale (media)
A. Iodice
La varianza
Altri indici di
variabilità
Calcolo della media aritmetica
Per calcolare la media aritmetica bisogna individuare i centri di ciascuna classe e tenere conto delle
frequenze. Ricordando la formula della media aritmetica
Mutua
variabilità
Pk
µ=
i=1
Esercizio sulla
variabilità
X
[60, 62]
[63, 65]
[66, 68]
[69, 71]
[72, 74]
Pk
µ=
A. Iodice ()
i=1
Freq=ni
5
18
42
27
8
100
ci × ni
n
=
ci × ni
n
centri=ci
61
64
67
70
73
ci × ni
305
1152
2814
1890
584
6745
305 + 1152 + 2814 + 1890 + 584
Esercitazione 4
100
= 67.45
Statistica
15 / 21
Esercizio: svolgimento
Esercitazione
4
Quesito 2
Misurare la variabilità rispetto ad un centro : scostamento medio semplice
A. Iodice
La varianza
Calcolo dello scostamento medio semplice
Altri indici di
variabilità
Per ottenere lo scostamento medio semplice bisogna calcolare il valore assoluto degli scarti dei centri delle
classi dalla media e tenere conto delle frequenze. Ricordando la formula dello scostamento medio semplice
Mutua
variabilità
Pk
MD =
i=1
Esercizio sulla
variabilità
X
[60, 62]
[63, 65]
[66, 68]
[69, 71]
[72, 74]
Pk
MD =
A. Iodice ()
i=1
Freq=ni
5
18
42
27
8
100
| ci − µ | ×ni
n
=
centri=ci
61
64
67
70
73
| ci − µ | ×ni
n
| ci − µ |
6.45
3.45
0.45
2.55
5.55
| ci − µ | ×ni
32.25
62.10
18.90
68.85
44.40
226.5
32.25 + 62.1 + 18.9 + 68.85 + 44.4
Esercitazione 4
100
=
226.5
100
= 2.265
Statistica
16 / 21
Esercizio: svolgimento
Esercitazione
4
Quesito 2
Misurare la variabilità rispetto ad un centro : scarto quadratico medio
A. Iodice
La varianza
Calcolo della varianza
Altri indici di
variabilità
Per ottenere lo scarto quadratico medio, si procede al calcolo della varianza che rappresenta il valore medio
dei quadrati degli scarti dalla media aritmetica: bisogna calcolare i quadrati degli scarti dei centri delle classi
dalla media e tenere conto delle frequenze. Ricordando la formula della varianza
Pk
2
2
i=1 (ci − µ) × ni
s =
n
Mutua
variabilità
Esercizio sulla
variabilità
X
[60, 62]
[63, 65]
[66, 68]
[69, 71]
[72, 74]
2
s
=
Freq=ni
5
18
42
27
8
centri=ci
61
64
67
70
73
100
(ci − µ)2
41.60
11.90
0.20
6.50
30.80
(ci − µ)2 × ni
208.0125
214.245
8.505
175.5675
246.42
852.75
208.0125 + 214.245 + 8.505 + 175.5675 + 246.42
100
=
852.75
100
= 8.5275
√
da cui lo scarto quadratico medio s = 8.5275 = 2.92
A. Iodice ()
Esercitazione 4
Statistica
17 / 21
Esercizio: svolgimento
Esercitazione
4
Quesito 2
Misurare la variabilità rispetto ad un centro : scarto quadratico medio
A. Iodice
La varianza
Calcolo della varianza
Altri indici di
variabilità
Ripetendo il calcolo utilizzando la formula alternativa per il calcolo della varianza
Mutua
variabilità
s
2
Pk
=
i=1
c2
i × ni
N
Pk
i=1
−
ci × ni
!2
N
Pk
i=1
=
c2
i × ni
N
2
− (µ)
Esercizio sulla
variabilità
X
[60, 62]
[63, 65]
[66, 68]
[69, 71]
[72, 74]
s
2
Pk
=
i=1
c2
i × ni
N
Freq=ni
5
18
42
27
8
100
Pk
−
i=1
ci
N
da cui lo scarto quadratico medio s =
A. Iodice ()
!2
=
centri=ci
61
64
67
70
73
455803
100
„
−
c2
i
3721
4096
4489
4900
5329
6745
100
c2
i × ni
18605
73728
188538
132300
42632
455803
«2
= 4558.03 − 4549.503 = 8.5275
√
8.5275 = 2.92
Esercitazione 4
Statistica
18 / 21
Esercizio: svolgimento
Esercitazione
4
A. Iodice
Quesito 3
Misurare la mutua variabilità : differenza media semplice
La varianza
Altri indici di
variabilità
Mutua
variabilità
Calcolo della mutua variabilità
La differenza media semplice corrisponde al valore medio delle differenze tra le possibili coppie di modalità.
PN
Esercizio sulla
variabilità
∆=
i6=j=1
|xi − xj |
N (N − 1)
la quantità al denominatore (N (N − 1)) rappresenta il numero di possibili coppie di n osservazioni.
Nel caso di intervalli di valori e di distribuzione di frequenze si fa riferimento ai centri delle classi ci e alle
frequenze. La formula da utilizzare è la seguente
Pk
∆=
A. Iodice ()
i6=j=1
|xi − xj | × ni × nj
N (N − 1)
Esercitazione 4
Statistica
19 / 21
Esercizio: svolgimento
Esercitazione
4
Quesito 3
Misurare la mutua variabilità : differenza media semplice
A. Iodice
La varianza
Altri indici di
variabilità
Mutua
variabilità
Esercizio sulla
variabilità
X
[60, 62]
[63, 65]
[66, 68]
[69, 71]
[72, 74]
A. Iodice ()
Freq=ni
5
18
42
27
8
100
centri=ci
61
64
67
70
73
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Esercitazione 4
| ci − cj |
3
6
9
12
3
3
6
9
6
3
3
6
9
6
3
3
12
9
6
3
ni × nj
90
210
135
40
90
756
486
144
210
756
1134
336
135
486
1134
216
40
144
336
216
| ci − cj | ×ni × nj
270
1260
1215
480
270
2268
2916
1296
1260
2268
3402
2016
1215
2916
3402
648
480
1296
2016
648
31542
Statistica
20 / 21
Esercizio: svolgimento
Esercitazione
4
Quesito 3
A. Iodice
Misurare la mutua variabilità : differenza media semplice metodo rapido.
La varianza
ci − cj
3
6
9
12
3
6
9
3
6
3
Altri indici di
variabilità
Mutua
variabilità
Esercizio sulla
variabilità
ci /cj
61
64
67
70
73
61
25
90
210
135
40
64
90
324
756
486
144
2×
∆=
=
A. Iodice ()
67
210
756
1764
1134
336
70
135
486
1134
729
216
Pk−1 Pk
i=1
73
40
144
336
216
64
j=(i+1)
|xi − xj | × ni × nj
N (N − 1)
=
(3 × 90) + (6 × 210) + (9 × 135) + . . . + (3 × 216)
100 × 99
Esercitazione 4
ni × nj
90
210
135
40
756
486
144
1134
336
216
= 3.186
Statistica
21 / 21