Lezione 5 - Statistica

annuncio pubblicitario
Lezione 5
A. Iodice
La media
troncata
Lezione 5
La variabilità
Statistica
La varianza
Altri indici di
variabilità
Coefficiente di
variazione
Scostamento
medio semplice
Alfonso Iodice D’Enza
[email protected]
Università degli studi di Cassino
A. Iodice ()
Lezione 5
Statistica
1 / 26
Outline
Lezione 5
A. Iodice
La media
troncata
1
La media troncata
2
La variabilità
3
La varianza
4
Altri indici di variabilità
Coefficiente di variazione
Scostamento medio semplice
La variabilità
La varianza
Altri indici di
variabilità
Coefficiente di
variazione
Scostamento
medio semplice
A. Iodice ()
Lezione 5
Statistica
2 / 26
Trimmed mean - La media troncata
Lezione 5
A. Iodice
La media
troncata
La variabilità
La varianza
Altri indici di
variabilità
Coefficiente di
variazione
Scostamento
medio semplice
La media aritmetica risente della presenza di valori estremi. Per
limitare questo problema si calcola la media sui valori centrali
della distribuzione, eliminando il possibile effetto di valori
anomali.
Media troncata (α%)
Per calcolare la media troncata sugli 1 − α valori centrali di una
distribuzione si procede come segue:
1
ordinare i valori osservati in senso crescente;
2
individuare i valori corrispondenti ai percentili qa = α/2 e
qb = 1 − α/2;
3
4
A. Iodice ()
selezionare gli n∗ valori xi∗ tali che xi > qa e xi ≤ qb ;
P ∗
calcolare la media troncata µα = n1∗ ni=1 xi .
Lezione 5
Statistica
3 / 26
Trimmed mean - La media troncata
Lezione 5
A. Iodice
La media
troncata
Esempio media troncata α = 50%
La variabilità
{1, 5, 7, 13, 14, 15, 18, 18, 22, 23, 24, 25, 27, 28, 29}
La varianza
Altri indici di
variabilità
{1, 5, 7, 13, 14, 15, 18, 18, 22, 23, 24, 25, 27, 28, 29}
Coefficiente di
variazione
Scostamento
medio semplice
∗
n
1 X
14 + 15 + 18 + 18 + 22 + 23 + 24 + 25
µα = ∗
xi =
= 19.875
n i=1
8
A. Iodice ()
Lezione 5
Statistica
4 / 26
Trimmed mean - La media troncata
Lezione 5
A. Iodice
La media
troncata
La variabilità
La varianza
Altri indici di
variabilità
Coefficiente di
variazione
Scostamento
medio semplice
A. Iodice ()
Lezione 5
Statistica
5 / 26
Trimmed mean - La media troncata
Lezione 5
A. Iodice
La media
troncata
La variabilità
La varianza
Altri indici di
variabilità
Coefficiente di
variazione
Scostamento
medio semplice
A. Iodice ()
Lezione 5
Statistica
6 / 26
Trimmed mean - La media troncata
Lezione 5
A. Iodice
La media
troncata
La variabilità
La varianza
Altri indici di
variabilità
Coefficiente di
variazione
Scostamento
medio semplice
A. Iodice ()
Lezione 5
Statistica
7 / 26
Trimmed mean - La media troncata
Lezione 5
A. Iodice
La media
troncata
La variabilità
La varianza
Altri indici di
variabilità
Coefficiente di
variazione
Scostamento
medio semplice
A. Iodice ()
Lezione 5
Statistica
8 / 26
Trimmed mean - La media troncata
Lezione 5
A. Iodice
La media
troncata
La variabilità
La varianza
Altri indici di
variabilità
Coefficiente di
variazione
Scostamento
medio semplice
A. Iodice ()
Lezione 5
Statistica
9 / 26
Trimmed mean - La media troncata
Lezione 5
A. Iodice
La media
troncata
La variabilità
La varianza
Altri indici di
variabilità
Coefficiente di
variazione
Scostamento
medio semplice
A. Iodice ()
Lezione 5
Statistica
10 / 26
Indici di posizione e tipo di caratteri
Lezione 5
A. Iodice
La media
troncata
La variabilità
la moda si applica a tutte le tipologie di caratteri
La varianza
la mediana (quartili, quantili in generale) si applica a tutte
le tipologie di caratteri le cui modalità sono ordinabili
(mutabili rettilinee e variabili)
Altri indici di
variabilità
Coefficiente di
variazione
Scostamento
medio semplice
la media aritmetica si applica alle sole variabili quantitative
A. Iodice ()
Lezione 5
Statistica
11 / 26
Il concetto di variabilità
Lezione 5
A. Iodice
La media
troncata
La variabilità
La variabilità si definisce come l’attitudine di un fenomeno ad
assumere modalità differenti.
La variabilità può essere misurata in diversi modi:
La varianza
variabilità delle singole modalità x1 , x2 , . . . , xn rispetto ad
un indice di posizione
Altri indici di
variabilità
Coefficiente di
variazione
Scostamento
medio semplice
mutua variabilità
variabilità delle modalità x1 , x2 , . . . , xn ordinate in modo
crescente (usando la f. di ripartizione)
variabilità delle frequenze relative (applicabile anche a
mutabili)
A. Iodice ()
Lezione 5
Statistica
12 / 26
Requisiti per indici di variabilità
Lezione 5
A. Iodice
La media
troncata
La variabilità
Un indice per la misura della variabilità deve avere le seguenti
caratteristiche
La varianza
un indice di variabilità deve assumere valori maggiori o
uguali a 0
Altri indici di
variabilità
Coefficiente di
variazione
Scostamento
medio semplice
un indice di variabilità calcolato su una distribuzione di
costanti ugulae a 0
aggiungendo una costante alla variabile osservata, il valore
dell’indice non deve cambiare
A. Iodice ()
Lezione 5
Statistica
13 / 26
Definizione di varianza
Lezione 5
A. Iodice
La varianza un’indice che misura la variabilità di una variabile X
rispetto alla media aritmetica. In particolare la varianza σ 2 data dalla
media dei quadrati degli scarti (delle modalità dalla media)
La media
troncata
(x1 − µ)2 + (x2 − µ)2 + . . . + (xn − µ)2
=
n
n
1X
=
(xi − µ)2
n i=1
La variabilità
σ2 =
La varianza
Altri indici di
variabilità
Coefficiente di
variazione
Scostamento
medio semplice
per dati organizzati in frequenze (seriazione)
(x1 − µ)2 × n1 + (x2 − µ)2 × n2 + . . . + (xk − µ)2 × nk
=
n1 + n2 + . . . + nk
k
1X
=
(xi − µ)2 × ni
n i=1
σ2 =
A. Iodice ()
Lezione 5
Statistica
14 / 26
Definizione di varianza
Lezione 5
A. Iodice
La media
troncata
In alcuni casi la varianza può essere ottenuta attraverso una formula alternativa
che semplifica il calcolo
formula alternativa
La variabilità
La varianza
Altri indici di
variabilità
σ2 =
n
n
1X
1X 2
(xi − µx )2 =
(x + µ2x − 2xi µx ) =
n i=1
n i=1 | i
{z
}
quadrato del binomio
Coefficiente di
variazione
Scostamento
medio semplice
1
=
n
=
1
n
n
X
i=1
n
X
i=1
x2i
+
n
X
µ2x
−2
i=1
x2i + nµ2x − 2µx
n
X
!
xi µx
i=1
n
X
= portare le costanti fuori sommatoria
!
xi
i=1
=
n
n
1X
1X 2 1 2
xi + nµx − 2µx
xi =
n i=1
n
n i=1
| {z }
| {z }
µx2
µx
= µx2 + µ2x − 2µ2x = µx2 − µ2x
A. Iodice ()
Lezione 5
Statistica
15 / 26
Esempio di calcolo della varianza
Lezione 5
A. Iodice
Data la variabile X : numero di esami sostenuti prima di quello
di statistica osservata su un collettivo di n = 6 studenti
La media
troncata
La variabilità
La varianza
Altri indici di
variabilità
Coefficiente di
variazione
Scostamento
medio semplice
La varianza sarà dunque
n
1X
50.8333
2
σ =
(xi − µ)2 =
= 8.4722
n
6
i=1
A. Iodice ()
Lezione 5
Statistica
16 / 26
Lo scarto quadratico medio (standard deviation)
Lezione 5
A. Iodice
La media
troncata
La variabilità
La varianza
Altri indici di
variabilità
Coefficiente di
variazione
Scostamento
medio semplice
Una difficoltà di interpretazione della varianza dipende dal fatto
che tale indice espresso nell’unità di misura al quadrato della
variabile cui si riferisce. Per ovviare a questo problema si
utilizza lo scarto quadratico medio σ, dato da
v
u n
u1 X
(xi − µ)2
σ=t
n
i=1
dall’esempio precedente risulta dunque
r
50.8333
σ=
= 2.9107
6
A. Iodice ()
Lezione 5
Statistica
17 / 26
Calcolo della varianza
Lezione 5
A. Iodice
Si consideri un campione di n = 100 sportelli bancari e sia X : numero di
operazioni effettuate presso uno sportello nell’ultima settimana.
La media
troncata
X
[60, 62]
[63, 65]
[66, 68]
[69, 71]
[72, 74]
La variabilità
La varianza
Altri indici di
variabilità
Coefficiente di
variazione
Scostamento
medio semplice
Freq (ni )
5
18
42
27
8
100
Calcolare un indice di tendenza centrale (media)
Misurare la variabilità rispetto ad un centro (scarto quadratico
medio)
A. Iodice ()
Lezione 5
Statistica
18 / 26
Calcolo della varianza
Lezione 5
A. Iodice
La media
troncata
Calcolo della media aritmetica
Per calcolare la media aritmetica bisogna individuare i centri di ciascuna classe e tenere conto delle
frequenze. Ricordando la formula della media aritmetica
La variabilità
Pk
µx =
La varianza
i=1
ci × ni
n
Altri indici di
variabilità
Coefficiente di
variazione
Scostamento
medio semplice
X
[60, 62]
[63, 65]
[66, 68]
[69, 71]
[72, 74]
Pk
µx =
A. Iodice ()
i=1
ci × ni
n
Freq=ni
5
18
42
27
8
100
=
centri=ci
61
64
67
70
73
ci × ni
305
1152
2814
1890
584
6745
305 + 1152 + 2814 + 1890 + 584
Lezione 5
100
= 67.45
Statistica
19 / 26
Calcolo della varianza
Lezione 5
A. Iodice
Calcolo della varianza
Ripetendo il calcolo utilizzando la formula alternativa per il calcolo della varianza
La media
troncata
σ
La variabilità
2
2
= µx2 − (µx )
Pk
=
i=1
c2
i × ni
n
Pk
i=1
−
ci × ni
!2
n
La varianza
Altri indici di
variabilità
X
[60, 62]
[63, 65]
[66, 68]
[69, 71]
[72, 74]
Coefficiente di
variazione
Scostamento
medio semplice
σ
2
Pk
=
i=1
c2
i × ni
N
Freq=ni
5
18
42
27
8
100
Pk
−
i=1
ci
N
da cui lo scarto quadratico medio σ =
A. Iodice ()
!2
=
centri=ci
61
64
67
70
73
455803
100
−
c2
i
3721
4096
4489
4900
5329
6745
100
c2
i × ni
18605
73728
188538
132300
42632
455803
2
= 4558.03 − 4549.503 = 8.5275
√
8.5275 = 2.92
Lezione 5
Statistica
20 / 26
Massima variabilità
Lezione 5
La varianza può crescere indefinitamente perchè gli scarti delle modalità dalla media possono essere
A. Iodice
illimitatamente grandi
La situazione di massima variabilità per un collettivo con media µ, si ha quando su n modalità,
6=0
n − 1 sono nulle ed una sola modalità xi = nµ
La media
troncata
La variabilità
La varianza
σ
2
Altri indici di
variabilità
≤
n
1 X
n i=1
2
(xi − µ)
1
2
((n − 1)(0 − µ) +
n |
{z
}
=
n−1 modalità nulle
=
Coefficiente di
variazione
Scostamento
medio semplice
1
n
2
((n − 1)µ +
2 2
2
2
(n µ + µ − 2nµ )
|
{z
}
2
(nµ − µ)
)=
|
{z
}
unica modalità 6=0
=
sviluppo del binomio (nµ−µ)2
=
=
1
n
1
n
2
2
2
((n − 1)µ + µ (n + 1 − 2n)) =
2
2
2
((n − 1) µ + µ (n + 1 − 2n)) =
| {z }
µ2 in evid.
=
=
A. Iodice ()
1
n
1
n
2
2
(µ (n − 1 + n + 1 − 2n)) =
2
1
n
2
2
(µ (n − n)) =
2
(µ n(n − 1)) = µ (n − 1)
Lezione 5
Statistica
21 / 26
Le proprietà della varianza
Lezione 5
A. Iodice
La media
troncata
La variabilità
La varianza gode di alcune importanti proprietà di seguito
riportate:
La varianza
1
La varianza di X sempre un numero non negativo (≥ 0)
Altri indici di
variabilità
2
La varianza di X pari a 0 se e solo se X una costante
Coefficiente di
variazione
Scostamento
medio semplice
3
Se alla variabile X si aggiunge una costante, σx non
cambia
4
Se si moltiplica la variabile X per una costante b, si avr
σx∗ = b2 σx2
A. Iodice ()
Lezione 5
Statistica
22 / 26
Le proprietà della varianza
Lezione 5
A. Iodice
La media
troncata
Le proprietà 3 e 4 dipendono dalla proprietà di linearità della media aritmetica: si consideri Y = a + bX,
con a e b costanti. Dalla proprietà risulta che µy = a + bµx . Calcolando la varianza di Y si avrà:
La variabilità
2
σy =
La varianza
Altri indici di
variabilità
=
Coefficiente di
variazione
Scostamento
medio semplice
=
n
1 X
n 1=1
n
1 X
n 1=1
n
1 X
n 1=1
2
(yi − µy )
=
2
(yi − (a + bµx ))
2
(bxi − bµx )
=
=
n
1 X
n 1=1
n
1 X
n 1=1
2
(a + bxi − a − bµx )
2
((b)(xi − µx ))
=
=
n
n
X
1 X
2
2
2 1
2
2 2
b (xi − µx ) = b
(xi − µx ) = b σx
n i=1
n 1=1
A. Iodice ()
Lezione 5
Statistica
23 / 26
Il coefficiente di variazione (CV )
Lezione 5
A. Iodice
La media
troncata
La variabilità
La varianza è un indice assoluto, dipende quindi dall’unità di
misura della variabile. Un indice relativo di variabilità è il
coefficiente di variazione CV . E’ dato da
La varianza
CV =
Altri indici di
variabilità
Coefficiente di
variazione
Scostamento
medio semplice
σ
µ
essendo un numero puro consente il confronto fra fenomeni
rilevati in momenti diversi o espressi in unità di misura diverse
A. Iodice ()
Lezione 5
Statistica
24 / 26
Il coefficiente di variazione (CV )
Lezione 5
A. Iodice
La media
troncata
La variabilità
La varianza è un indice assoluto, dipende quindi dall’unità di
misura della variabile. Un indice relativo di variabilità è il
coefficiente di variazione CV . E’ dato da
La varianza
CV =
Altri indici di
variabilità
Coefficiente di
variazione
Scostamento
medio semplice
σ
µ
essendo un numero puro consente il confronto fra fenomeni
rilevati in momenti diversi o espressi in unità di misura diverse
Limiti di utilizzo del CV
è defnito solo se µ > 0
se µ → 0 il CV tende a diventare molto grande
A. Iodice ()
Lezione 5
Statistica
24 / 26
Scostamento medio semplice
Lezione 5
A. Iodice
La media
troncata
La variabilità
La varianza
Altri indici di
variabilità
Per ottenere lo scostamento medio semplice bisogna calcolare il
valore assoluto degli scarti dei centri delle classi dalla media e
tenere conto delle frequenze. Ricordando la formula dello
scostamento medio semplice
Coefficiente di
variazione
Scostamento
medio semplice
Pk
MD =
A. Iodice ()
i=1 | ci
Lezione 5
− µ | ×ni
n
Statistica
25 / 26
Esempio calcolo scostamento medio semplice
Lezione 5
A. Iodice
La media
troncata
Calcolo dello scostamento medio semplice
X
[60, 62]
[63, 65]
[66, 68]
[69, 71]
[72, 74]
La variabilità
La varianza
Altri indici di
variabilità
Coefficiente di
variazione
Scostamento
medio semplice
Pk
MD =
A. Iodice ()
i=1
Freq=ni
5
18
42
27
8
100
centri=ci
61
64
67
70
73
| ci − µ |
6.45
3.45
0.45
2.55
5.55
| ci − µ | ×ni
32.25
62.10
18.90
68.85
44.40
226.5
| ci − µ | ×ni
32.25 + 62.1 + 18.9 + 68.85 + 44.4
226.5
=
=
= 2.265
n
100
100
Lezione 5
Statistica
26 / 26
Scarica