Esercitazione 1.3

annuncio pubblicitario
22/10/2012
Corso di Statistica
Esercitazione 1.3
Indici di variabilità ed eterogeneità
Concentrazione
Asimmetria
Prof.ssa T. Laureti
a.a. 2012-2013
Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
1
1
1
22/10/2012
Esercizio 1
Si considerino i seguenti dati relativi al numero di
addetti nelle imprese presenti in un determinato
comune
7
5
8
4
11 9
15 18 10 6
3
19 12 14 9
Determinare:
•
la media aritmetica
•
•
•
lla mediana
di
il range
la varianza
2
Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
2
22/10/2012
a) Calcolo della media aritmetica
Per un insieme di n=15 valori osservati del carattere
quantitativo “addetti”
addetti la formula della media
aritmetica è la seguente:
1
1 n
x a = (x 1 + x 2 + ... + x n ) = ∑ x i
n
n i =1
Q i di
Quindi:
7
5
8
4
11 9
15 18 10 6
3
19 12 14 9
1
xa = (7 + 5 + 8 + ... + 9 ) = 10
15
3
Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
3
22/10/2012
b) Calcolo della mediana
Per individuare la posizione mediana è necessario
ordinare le osservazioni in senso non decrescente:
3
4
5
6
7
8
9
9
10 11 12 14 15 18 19
Posizione
mediana
L posizione
La
i i
centrale
t l per n di
disparii ((n=15)
15) è d
data
t d
da
(n + 1) 16
=
=8
2
2
Quindi Me=9
4
Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
4
22/10/2012
Addetti
xj
7
5
8
4
11
d) Calcolo del range
L’indice di variabilità range espresso dalla
differenza tra il valore massimo e il valore
minimo della distribuzione, ossia
range = xmax − xmin
9
15
Nella distribuzione considerata si ha:
18
10
6
3
19
12
14
Mi 3
Min=3
M
Max=19
19
Quindi:
range = 19 − 3 = 16
9
5
Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
5
22/10/2012
Addetti
xi
Scarti dalla
media
(xi-µ)
d) Calcolo della varianza
Quadrato
degli scarti
(xi-µ)2
7
-3
9
5
-5
25
8
-2
2
4
4
-6
36
11
1
1
9
-1
1
1
15
5
25
18
8
64
10
0
0
6
-4
16
3
-7
7
49
19
9
81
12
2
4
14
4
16
9
-1
1
n
2
(
)
x
−
x
∑ i
= Dev(X) = 332
i=1
1 n
332
2
σ = ∑ ( xi − x ) =
= 22,13
n i =1
15
2
1 n
2
(
)
σ =
x
−
x
=
∑
i
n i=1
= 22,13 = 4,70
6
Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
6
22/10/2012
Esercizio 2.
La seguente distribuzione riporta il numero di chilometri
percorsi in una settimana da 31 rappresentanti di commercio
di una nota marca di occhiali da sole .
Classi di
chilometri
[400 – 450)
[ 450 - 500)
[ 500 - 550)
[ 550 - 600)
[ 600 - 650))
totale
6
9
7
6
3
31
7
Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
7
22/10/2012
A) Calcolare le frequenze relative, le frequenze
percentuali e le frequenze relative cumulate
B) Determinare il numero medio di chilometri
percorsi.
percorsi
C) Calcolare la mediana e il primo quartile.
D) Misurare la variabilità della distribuzione
utilizzando la deviazione standard
8
Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
8
22/10/2012
A) Calcolo delle frequenze relative, frequenze
percentuali e relative cumulate
f1 =
6
= 0,194
31
Classi di
chilometri
[400 – 450)
[ 450 - 500)
[ 500 - 550)
[ 550 - 600)
[ 600 - 650))
totale
f2 =
9
= 0,290 …
31
nj
6
9
7
6
3
31
fj
pj
0,194 19,4
0,290 29,0
0,226 22,6
0,194 19,4
0,097
9,7
,
1,000 100,0
Fjj
0,194
0,484
0,710
0,903
1,000
9
Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
9
22/10/2012
B) Calcolo della media aritmetica
Classi di
chilometri
x j − x j +1
[400 – 450)
[ 450 - 500))
[ 500 - 550)
[ 550 - 600)
[ 600 - 650)
totale
nj
6
9
7
6
3
31
cj*nj
Valore
centrale
classi (cj)
425
475
525
575
625
2.550
4.275
3.675
3.450
1.875
15 825
15.825
K
xa ≈
∑c n
j
j =1
n
j
=
15.825
= 510,48
31
10
Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
10
22/10/2012
C) Calcolo della mediana
1. Individuazione della classe mediana
Classi di
chilometri
nj
[400 – 450)
[ 450 - 500)
[ 500 - 550)
[ 550 - 600)
[ 600 - 650)
t t l
totale
6
9
7
6
3
31
rango mediana =
n + 1 31 + 1
=
= 16
2
2
Fj
Nj
6
15
22
28
31
0,194
0 484
0,484
0,710
0 903
0,903
1,000
La mediana è
contenuta nella
classe 500-550
11
Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
11
22/10/2012
C) Calcolo della mediana
2. Individuazione della mediana nella classe sotto l’ipotesi
di distribuzione uniforme (applicazione della formula)
⎛ 0,5 − Fm −1 ⎞
⎟⎟∆ m
Me ≈ I m + ⎜⎜
F
−
F
m −1 ⎠
⎝ m
Classi di
chilometri
nj
Nj
[400 – 450)
[ 450 - 500)
6
9
[ 500 - 550)
7
6 0,194
15 0,484
22 0,710
[ 550 - 600)
6
[ 600 - 650)
3
totale
31
Fj
28 0,903
1 000
31 1,000
Im=estr inf della classe
mediana=500
Fm-1=freq rel cum fino
alla classe precedente a
quella mediana =0,484
Fm=freq
freq rel cum
fino alla classe
mediana=0,710
∆m=ampiezza
i
d
della
ll
classe mediana=
=550-500=50
⎛ 0,5 − Fm −1 ⎞
⎛ 0,5 − 0,484 ⎞
⎜
Me ≈ I m + ⎜
∆ m = 500 + ⎜
∗ 50 = 503,57
⎟
12
⎝ 0,710 − 0,484 ⎠
⎝ Fm − Fm −1 ⎠
Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
12
22/10/2012
C) Calcolo del primo quartile
Q1 è il primo
i
valore
l
xii in
i corrispondenza
i
d
d
dell quale
l
la frequenza cumulata relativa Fj ≥ 0,25
Classi di
chilometri
nj
Fj
Nj
[400 – 450)
6
6
0,194
[ 450 - 500)
9
15
0,484
[ 500 - 550)
7
22
0 710
0,710
[ 550 - 600)
6
28
0,903
[ 600 - 650)
3
31
1,000
totale
31
⎛ 0, 25 − FQ1 −1 ⎞
,
⎛ 0,, 25 − 0,194
⎞
Q1 ≈ I Q1 + ⎜
∆
=
450
+
459, 72
⎟
⎜ 0, 484 − 0,194 ⎟ 50 = 459
⎜ FQ − FQ −1 ⎟ Q1
⎝
⎠
1
⎝ 1
⎠
13
Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
13
22/10/2012
D) Calcolo della deviazione standard
Classi di
chilometri
[400 – 450)
[ 450 - 500)
[ 500 - 550)
[ 550 - 600)
[ 600 - 650)
totale
xa = 510,48
nj
Valore
centrale
classi
(cj)
6
9
7
6
3
31
(cj-µ)2
425 7306,8
475 1258,8
210,8
525
575 4162,8
625 13114,8
(cj-µ)2*nj
43840,8
11329,2
1475,6
24976,8
39344,4
120966,8
1 K
120966,8
,
2
σ = ∑ (c j − x ) nj =
= 3902,15
3902 15
n j=1
31
2
σ = 3902,15
= 62,47
Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
14
14
22/10/2012
Esercizio 3
Si consideri la seguente distribuzione di 100
imprese per classi di fatturato:
Classi di fatturato
(migliaia di euro)
N.
imprese
p
(0-20]
30
(20-50]
50
(50-100]
20
T l
Totale
100
a)) Rappresentare
pp
g
graficamente la distribuzione
b) Determinare la moda
15
Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
15
22/10/2012
a) Costruzione dell’istogramma.
Le classi hanno diversa ampiezza
ampiezza. E’
E necessario
calcolare la densità di frequenza
Classi di fatturato
((migliaia
g
di euro))
nj
Ampiezza
classe
(aj)
Densità di
q
freq
(hj)
0 20
0-20
30
20
15
1,5
20-50
50
30
1,67
50-100
20
50
0,4
Totale
100
b) La classe modale è quella che ha la densità di frequenza
maggiore. Quindi la classe modale è 20-50
16
Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
16
22/10/2012
ISTOGRAMMA
hi
1,7
1,5
0,4
0
20
50
100
17
Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
17
22/10/2012
Esercizio 4
Si consideri la distribuzione degli
g alunni della scuola
secondaria di primo grado per giudizio riportato
all’esame di Stato nell’Anno scolastico 2006/07 in
Italia (dati Istat)
Giudizio
Licenziati
Sufficiente
37 1
37,1
Buono
26,4
Distinto
19 2
19,2
Ottimo
17,3
100 0
100,0
Determinare la moda e la mediana.
Misurare l’eterogeneità della distribuzione
18
Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
18
22/10/2012
Si tratta di una distribuzione percentuale
Gi di i
Giudizio
Li
Licenziati
i ti
Sufficiente
37,1
0,371
0,371
B
Buono
26 4
26,4
0 264
0,264
0 635
0,635
Distinto
19,2
0,192
0,827
O i
Ottimo
17 3
17,3
0 173
0,173
1
100,0
1,000
Fj
fj
La moda, ossia la modalità più frequente è sufficiente
Per il calcolo
P
l l d
della
ll mediana
di
sulla
ll colonna
l
d
delle
ll
frequenze relative cumulate si individua la prima Fj
che è uguale o maggiore di 0,5
La mediana è Buono
19
Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
19
22/10/2012
b) Eterogeneità della distribuzione
Gi di i
Giudizio
Li
Licenziati
i ti
Sufficiente
37,1
0,371
0,1376
B
Buono
26 4
26,4
0 264
0,264
0 0697
0,0697
Distinto
19,2
0,192
0,0369
O i
Ottimo
17 3
17,3
0 173
0,173
0 0299
0,0299
100,0
1,000
0,2741
f2j
fj
K
E1 = 1 − ∑ f j2 = 1 − 0,2741 = 0,7259
j =1
e1 =
0 ≤ E1 ≤
K −1 3
= = 0,75
K
4
0,7259
= 0,968
0,75
20
Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
20
22/10/2012
Esercizio 1
Le
e retribuzioni,
e bu o , in migliaia
g aa d
di eu
euro,
o, d
di 5 d
dipendenti
pe de
di u
d
un g
grande
a de
magazzino risultano le seguenti:
10
20
28
8
14
a) Disegnare la curva di Lorenz;
b) Misurare la concentrazione.
21
Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
21
22/10/2012
Per la distribuzione precedente è necessario ordinare innanzitutto le
intensità del carattere. Quindi si procede al calcolo di Fi e Qi
Retribuzioni
(valori
ordinati)
Intens. ass.
cum. Ai
Freq.
rel.
cum.
Fi
Intens.
rel. cum.
Qi
Fi - Qi
8
8
0,20
0,100 0,100
10
18
0 40
0,40
0 225 0,175
0,225
0 175
14
32
0,60
0,400 0,200
20
52
0,80
0,650 0,150
28
80
1,00
1,000
Fi =
i 3
=
n 5
Qi =
A i 32
=
A n 80
22
Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
22
22/10/2012
a) Curva di Lorenz
Qi
1,000
superficie di
concentrazione
0,650
0,400
0,225
0 100
0,100
0,2
0,4
0,6
0,8
1,0
Fi
n-1
b)
R=
∑ (F − Q )
i =1
i
i
n −1
∑F
i =1
i
=
0, 625
,
=0,3125
2
Si è in presenza di una modesta concentrazione23
Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
23
22/10/2012
Esercizio 2
Si consideri la seguente
g
distribuzione delle industrie del legno
g
p
per
classi di fatturato in migliaia e fatturato totale per classe
(milioni):
Classi di
fatturato
Fatturato
totale
nJ
0-5
0
5
750
1.930
5-10
420
3.260
10-25
390
6.350
25-50
25
50
180
5 450
5.450
Oltre 50
150
76.400
1.890
Determinare il rapporto di concentrazione.
24
Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
24
22/10/2012
Per il calcolo dell’indice di concentrazione deve essere utilizzato il fatturato totale
che è noto (intensità)
Classi di
fatturato
nJ
Nj
Fatturato
totale
(intensità Aj)
Fi=
Nj/n
Qj=
Aj/AK
0-5
750 750
1.930
0,397
0,021
5-10
5
10
420 1170
5.190
0,619
0,056
10-25
390 1560
11.540
0,825
0,124
25-50
180 1740
16.990
0,921
0,182
Olt 50
Oltre
150 1890
93 390
93.390
1 000
1,000
1 000
1,000
1.890
25
Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
25
22/10/2012
Quindi:
Classi di
fatturato
Fi=
Nj/n
Qj=
Aj/AK
Fj+1-Fj
Qj+1+Qj
(Fj+1-Fj)(Qj+1+Qj)
0-5
0,397
0,021
0,397
0,021
0,008
5-10
0,619
0,056
0,222
0,076
0,017
10-25
0 2
0 82
0,825
0 2
0,124
0 206
0,206
0
0,179
9
0 03
0,037
25-50
0,921
0,182
0,095
0,305
0,029
Oltre 50
1,000
1,000
0,079
1,182
0,094
0,185
R = 1 – 0,185
0 185 = 0
0,815
815
Elevata concentrazione del fatturato tra le imprese
p
26
Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
26
22/10/2012
Esercizio 3
Si consideri la seguente distribuzione delle famiglie per classi
di reddito mensile in migliaia di euro
Classi di
reddito
Famiglie
nj
0-2
0
2
2
2-6
4
6-8
3
8-10
1
10
A) Disegnare la curva di Lorenz
B) Misurare la concentrazione del reddito
27
Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
27
22/10/2012
Classi
cj
nJ
Nj
cj*nj
Fi=
Nj/n
Aj
Qj=
Aj/AK
0-2
1
2
2
0,2
2
2-6
4
4
6
0,6
16
18 18/48=0,375
6-8
6
8
7
3
9
0,9
21
39 39/48
39/48=0,813
0,813
8-10
9
1
10
1,0
9
48 48/48=1,000
10
2 2/48=0,042
48
1,000
Qi
superficie di
concentrazione
0,813
0,375
Pi
0,042
0,2
28
0,6
0,9 1,0
28
22/10/2012
Classi
Fi=
Nj/n
Qj=
Aj/AK
(Fj+1- Fj)
(Qj+1+Qj)
(Fj+1Fj)(Qj+1+Qj)
0-2
0,2 0,042
0,2
0,042
0,0084
2-6
0,6 0,375
0,4
0,417
0,1668
6 8
6-8
0 9 0,813
0,9
0 813
03
0,3
1 188
1,188
0 3564
0,3564
8-10
1,0 1,000
0,1
1,813
0,1813
k −1
R = 1 − ∑ (F j +1 − F j )(Q j +1 + Q j ) = 1 − 0,7129 =
j =0
R = 0,2871
Modesta concentrazione
29
Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
29
22/10/2012
Esercizio 4
o d
la
a seguente
gu
distribuzione
d
bu o
di
d 20
0 imprese
p
secondo
o do il
Si consideri
numero di addetti:
Addetti
N. imprese
1
10
3
5
5
3
10
2
20
Misurare l’asimmetria della distribuzione
30
Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
30
22/10/2012
Si può procedere ad una rappresentazione grafica per valutare il grado di
simmetria della distribuzione
Imprese secondo il numero di addetti
12
10
8
6
4
2
0
1
3
5
10
31
Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
31
22/10/2012
Addetti
(x
NJ
N imprese
N.
j
−X
) (x
3
j − X
1
10
10
-8
-80
3
5
15
0
0
5
3
18
8
24
10
2
20
343
686
σ = 2,
2 74
β =
M3
σ
3
=
j
630
20
X =3
)n
3
Mo =1
Me =1
630 20
= 1, 531
20,571
La distribuzione è asimmetrica positiva
32
Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
32
22/10/2012
Indagine Bankitalia sul reddito delle famiglie italiane nel 2006
(tiene conto
(ti
t della
d ll composizione
i i
demografica della famiglia)
entrambe le distribuzioni sono
asimmetriche positive
33
33
Scarica