Outline
Statistica Sociale - modulo A
e-mail: [email protected]
Prof.ssa D.F. Iezzi
Prof.ssa D.F. Iezzi
Statistica Sociale - modulo A e-mail: [email protected]
Outline
i quartili
ESEMPIO: i quartili
IL TERZO QUARTILE
ESEMPIO: i quartili per un carattere diviso in classi
La variabilita’
Proprieta’ di un indice di variabilita’
Indici di variabilita’
La varianza
altri indici di variabilita’
IL BOX PLOT
I VALORI ANOMALI
ESEMPIO: il boxplot
Prof.ssa D.F. Iezzi
Statistica Sociale - modulo A e-mail: [email protected]
Outline
ESEMPIO: i quartili
La variabilita’
Proprieta’ di un indice di variabilita’
Indici di variabilita’
La varianza
altri indici di variabilita’
IL BOX PLOT
I VALORI ANOMALI
I QUARTILI I quartili sono tre indici che dividono la distribuzione
ordinata in 4 parti uguali.
Il primo quartile (Q1 ) e’ il valore che lascia alla propria sinistra il
25% dei termini e il 75% alla destra.
Il secondo quartile (Q2 ) e’ il valore spacca in due parti uguali la
distribuzione (il secondo quartile coincide con la mediana).
Il terzo quartile (Q3 ) e’ il valore che lascia alla propria sinistra il
75% dei termini e il 25% alla destra.
Prof.ssa D.F. Iezzi
Statistica Sociale - modulo A e-mail: [email protected]
Outline
ESEMPIO: i quartili
La variabilita’
Proprieta’ di un indice di variabilita’
Indici di variabilita’
La varianza
altri indici di variabilita’
IL BOX PLOT
I VALORI ANOMALI
ESEMPIO Data la seguente distribuzione: 5,
6,2,2,1,5,10,12,3,2,5,6. Individuare i quartili.
ORDINO LA DISTRIBUZIONE: 1 2 2 2 3 5 5 5 6 6 10 12
Il primo quartile (Q1 ) si trova nella seguente posizione:
Q1 = 0, 25 ∗ 12 = (1/4)12 = 3
Il primo quartile si trova in terza posizione e il valore e’ Q1 = 2
Il secondo quartile (Q2 ) si trova nella seguente posizione:
n=pari
12
n
5+5
n
2 = 2 = 6 e 2 + 1 = 7 Q2 = 2 = 5
Il terzo quartile (Q3 ) si trova nella seguente posizione:
Q3 = 0, 75 ∗ 12 = (3/4)12 = 9
LaQ3 si trova in posizione 9 e il valore e’ Q3 = 6
Prof.ssa D.F. Iezzi
Statistica Sociale - modulo A e-mail: [email protected]
Outline
ESEMPIO: i quartili
La variabilita’
Proprieta’ di un indice di variabilita’
Indici di variabilita’
La varianza
altri indici di variabilita’
IL BOX PLOT
I VALORI ANOMALI
IL PRIMO QUARTILE
Q1 ' IQ1 +
0.25 − FQ1−1
aQ1
FQ1 − FQ1−1
IQ1 e’ l’estremo inferiore della classe dove cade Q1
FQ1−1 e’ la frequenza relativa cumulata fino alla classe precedente
a quella dove cade Q1 ;
FQ1 e’ la frequenza relativa cumulata della classe dove cade Q1
aQ1 e’ l’ampiezza della classe dove cade Q1
Prof.ssa D.F. Iezzi
Statistica Sociale - modulo A e-mail: [email protected]
Outline
ESEMPIO: i quartili
La variabilita’
Proprieta’ di un indice di variabilita’
Indici di variabilita’
La varianza
altri indici di variabilita’
IL BOX PLOT
I VALORI ANOMALI
IL SECONDO QUARTILE E’ LA MEDIANA
IL TERZO QUARTILE
Q3 ' IQ3 +
0.75 − FQ3−1
aQ3
FQ3 − FQ3−1
IQ3 e’ l’estremo inferiore della classe dove cade Q3
FQ3−1 e’ la frequenza relativa cumulata fino alla classe precedente
a quella dove cade Q1
FQ3 e’ la frequenza relativa cumulata della classe dove cade Q3
aQ3 e’ l’ampiezza della classe dove cade Q3
Prof.ssa D.F. Iezzi
Statistica Sociale - modulo A e-mail: [email protected]
Outline
ESEMPIO: i quartili
La variabilita’
Proprieta’ di un indice di variabilita’
Indici di variabilita’
La varianza
altri indici di variabilita’
IL BOX PLOT
I VALORI ANOMALI
Data la distribuzione di frequenza per classi di addetti dell’AREA
X, calcolare i quartili. Q1 = 0 + ( 0,25−0
0,35−0 )5 = 0, 71x5 = 3, 57
0,15
Q2 = 6 + ( 0,50−0,35
0,53−0,35 )4 = 6 + ( 0,18 )4 = 9, 33
0,75−0,53
Q3 = 11 + ( 0,76−0,53
)19 = 11 + ( 0,22
0,23 )19 = 29, 17
Prof.ssa D.F. Iezzi
Statistica Sociale - modulo A e-mail: [email protected]
Outline
ESEMPIO: i quartili
La variabilita’
Proprieta’ di un indice di variabilita’
Indici di variabilita’
La varianza
altri indici di variabilita’
IL BOX PLOT
I VALORI ANOMALI
Nella descrizione di un fenomeno, un indice di posizione fornisce
informazioni riassuntive sulla distribuzione. La sintesi mediante una
media e’ rappresentativa soltanto se le unita’ statistiche presentano
modalita’ prossime a questa. Molto spesso, distribuzioni
caratterizzate dall’uguaglianza nei valori degli indici di posizione,
possono riflettere situazioni molto diverse tra di loro.
ESEMPIO
Si consideri il peso (in Kg) di due gruppi di studenti (A e B).
A = 60, 55, 70, 40, 90, 70, 76, 72, 56, 61
B = 65, 65, 65, 65, 65, 65, 65, 65, 65, 65
Pn
P10
xi 650
i=1 xi
xA =
= i=1
= 65
n
=
10
Pn
P10
xi
xi 650
x B = i=1 = i=1
= 65
n
=
10
Prof.ssa D.F. Iezzi
Statistica Sociale - modulo A e-mail: [email protected]
Outline
ESEMPIO: i quartili
La variabilita’
Proprieta’ di un indice di variabilita’
Indici di variabilita’
La varianza
altri indici di variabilita’
IL BOX PLOT
I VALORI ANOMALI
La variabilita’ esprime la tendenza delle unita’ di un collettivo ad
assumere diverse modalita’ del carattere.
Un indice di variabilita’ (V(x)) presenta i seguenti requisiti:
1. V(X)= 0, se tutte le unita’ presentano la medesima modalita’
del carattere (distribuzione degenere);
2. V (X ) > 0 risulta crescente al crescere della diversita’ tra le
modalita’ assunte dalle diverse unita’;
3. V (X + c) = V (x) + c: aggiungendo una costante c ai valori di
X, la variabilita’ non cambia;
4. Se V (X ) ≥ V (Y ) allora il vettore X e’ piu’ variabile di Y.
Prof.ssa D.F. Iezzi
Statistica Sociale - modulo A e-mail: [email protected]
Outline
ESEMPIO: i quartili
La variabilita’
Proprieta’ di un indice di variabilita’
Indici di variabilita’
La varianza
altri indici di variabilita’
IL BOX PLOT
I VALORI ANOMALI
E possibile distinguere tre categorie di indici di variabilita’:
1. Indici di dispersione rispetto ad una media;
2. Indici di disuguaglianza a coppie (Mutua variabilita’ );
3. Indici di mutabilita’, che misurano lomegenita’/eterogenieta’ tra
le modalita’ di una distribuzione di frequenza.
Nelle tre categorie sopraccitate, e’ possibile operare una ulteriore
distinzione tra gli indici:
a) Assoluti: utilizzano la stessa unita’ di misura della modalita’
della distribuzione, ma non consentono di fare confronti fra
distribuzioni statistiche espresse in unita’ di misura diverse;
b) Relativi: depurano la distribuzione dall’unita’ di misura, per
questo motivo sono particolarmente adatti per operare confronti
fra distribuzioni. Si ottengono rapportando un indice assoluto al
suo massimo o ad una
media.
Prof.ssa
D.F. Iezzi
Statistica Sociale - modulo A e-mail: [email protected]
Outline
ESEMPIO: i quartili
La variabilita’
Proprieta’ di un indice di variabilita’
Indici di variabilita’
La varianza
altri indici di variabilita’
IL BOX PLOT
I VALORI ANOMALI
P
σ 2 = n1 ni=1 (xi − x)2
ESEMPIO
Si consideri il peso (in Kg) di due gruppi di studenti (A e B).
A = 60, 55, 70, 40, 90, 70, 76, 72, 56, 61
B = 65, 65, 65, 65, 65, 65, 65, 65, 65, 65
= 169, 2
σ 2 = 1692
q10 P
1
σ = n ni=1 (xi − x)2 = σ = 13
Prof.ssa D.F. Iezzi
Statistica Sociale - modulo A e-mail: [email protected]
Outline
xi
60
55
70
40
90
70
76
72
56
61
tot
(xi − x)
-5
-10
5
-25
25
5
11
7
-9
-4
-
Prof.ssa D.F. Iezzi
ESEMPIO: i quartili
La variabilita’
Proprieta’ di un indice di variabilita’
Indici di variabilita’
La varianza
altri indici di variabilita’
IL BOX PLOT
I VALORI ANOMALI
(xi − x)2
25
100
25
625
625
25
121
49
81
16
1692
Statistica Sociale - modulo A e-mail: [email protected]
ESEMPIO: i quartili
La variabilita’
Proprieta’ di un indice di variabilita’
Indici di variabilita’
La varianza
altri indici di variabilita’
IL BOX PLOT
I VALORI ANOMALI
Outline
xj
0
1
2
3
Totale
nj
5
20
11
26
62
xj nj
0
20
22
78
120
(xi − x)
-2
-1
0
1
x=
(xi − x)2
4
1
0
1
(xi − x)2 nj
20
20
0
26
66
120
=2
62
σ 2 = 66
62 = 1, 064
σ = 1, 031
Prof.ssa D.F. Iezzi
Statistica Sociale - modulo A e-mail: [email protected]
Outline
ESEMPIO: i quartili
La variabilita’
Proprieta’ di un indice di variabilita’
Indici di variabilita’
La varianza
altri indici di variabilita’
IL BOX PLOT
I VALORI ANOMALI
SCOSTAMENTO SEMPLICE
MEDIO DALLA MEDIA
P
ARITMETICA Sx = n1 ni=1 |xi − x|
SCOSTAMENTO
SEMPLICE MEDIO DALLA MEDIANA
1 Pn
Sx = n i=1 |xi − Me|
COEFFICIENTE DI VARIAZIONE
CV = ( σx )100
Prof.ssa D.F. Iezzi
Statistica Sociale - modulo A e-mail: [email protected]
Outline
ESEMPIO: i quartili
La variabilita’
Proprieta’ di un indice di variabilita’
Indici di variabilita’
La varianza
altri indici di variabilita’
IL BOX PLOT
I VALORI ANOMALI
La descrizione di un carattere mediante un indice di posizione
andrebbe sempre accompagnata da un indice di variabilita’. Il
grafico a scatola (o box-plot) un particolare tipo di diagramma
che permette di rappresentare graficamente sia una media che la
variabilita’ di una distribuzione. Gli elementi che lo caratterizzano
sono: 1. una linea orizzontale interna alla scatola, che individua il
valore dell’indice di posizione (media o piu’ frequentemente
mediana); 2. un rettangolo (box) la cui altezza misura la differenza
contiene il 50% centrale della distribuzione, dal 1al 3quartile; 3.
due segmenti (i baffi) che individuano gli intervalli in cui sono
posizionati i valori rispettivamente minori di Q1 e maggiori di Q3
Prof.ssa D.F. Iezzi
Statistica Sociale - modulo A e-mail: [email protected]
Outline
ESEMPIO: i quartili
La variabilita’
Proprieta’ di un indice di variabilita’
Indici di variabilita’
La varianza
altri indici di variabilita’
IL BOX PLOT
I VALORI ANOMALI
E’ possibile, inoltre, rappresentare con valori esterni ai baffi i valori
anomali. Questi valori forniscono informazioni ulteriori sulla
dispersione e sulla forma della distribuzione. Si possono individuare
eventuali valori anomali, mediante le seguenti formule:
- limite inferiore (baffo inferiore) = Q1 − αDI
- limite superiore (baffo superiore) = Q3 + αDI
dove DI = Q3 − Q1 differenza interquartilica. Con α costante
positiva. I software di frequente fissano un valore di α pari a 1,5.
Quando i valori adiacenti, superiore e inferiore, coincidono con gli
estremi della distribuzione non comparir alcun valore fuori limite.
Prof.ssa D.F. Iezzi
Statistica Sociale - modulo A e-mail: [email protected]
Outline
ESEMPIO: i quartili
La variabilita’
Proprieta’ di un indice di variabilita’
Indici di variabilita’
La varianza
altri indici di variabilita’
IL BOX PLOT
I VALORI ANOMALI
2
4
6
8
10
12
ESEMPIO: Data la seguente distribuzione: 5, 6,2,2,1,5,10,12,3,2,5,6.
Disegnare il boxplot. DI=6-2=4
- limite inferiore (baffo inferiore) = 2 − 1, 5x4 = 2 − 6 = −4
- limite superiore (baffo superiore) = 6 + 1, 5x4 = 6 + 6 = 12
non ci sono valori anomali
Prof.ssa D.F. Iezzi
Statistica Sociale - modulo A e-mail: [email protected]