Esercitazione

annuncio pubblicitario
Corso di Statistica
Esercitazione 1.3
Indici di variabilità ed eterogeneità
Concentrazione
Asimmetria
Prof.ssa T. Laureti
a.a. 2014-2015
Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
1
1
Esercizio 1
Si considerino i seguenti dati relativi al numero di
addetti nelle imprese presenti in un determinato
comune
7
5
8
4
11 9
15 18 10 6
3
19 12 14 9
Determinare:
•
la media aritmetica
•
•
•
la mediana
il range
la varianza
2
Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
a) Calcolo della media aritmetica
Per un insieme di n=15 valori osservati del carattere
quantitativo “addetti” la formula della media
aritmetica è la seguente:
1
1 n
xa  (x1  x2  ...  xn )   xi
n
n i1
Quindi:
7
5
8
4
11 9
15 18 10 6
3
19 12 14 9
1
xa  7  5  8  ...  9  10
15
3
Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
b) Calcolo della mediana
Per individuare la posizione mediana è necessario
ordinare le osservazioni in senso non decrescente:
3
4
5
6
7
8
9
9
10 11 12 14 15 18 19
Posizione
mediana
La posizione centrale per n dispari (n=15) è data da
(n  1) 16
 8
2
2
Quindi Me=9
4
Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
Addetti
xj
7
5
8
4
11
d) Calcolo del range
L’indice di variabilità range espresso dalla
differenza tra il valore massimo e il valore
minimo della distribuzione, ossia
range  xmax  xmin
9
15
Nella distribuzione considerata si ha:
18
10
6
3
19
12
14
Min=3
Max=19
Quindi:
range  19  3  16
9
5
Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
Addetti
xi
Scarti dalla
media
(xi-μ)
d) Calcolo della varianza
Quadrato
degli scarti
(xi-μ)2
7
-3
9
5
-5
25
8
-2
4
4
-6
36
11
1
1
9
-1
1
15
5
25
18
8
64
10
0
0
6
-4
16
3
-7
49
19
9
81
12
2
4
14
4
16
9
-1
1
n
2


x

x
 i
 Dev(X)  332
i1
1 n
332
2
    xi  x  
 22,13
n i 1
15
2
1 n
2


 
x

x


i
n i1
 22,13  4,70
Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
6
Esercizio 2.
La seguente distribuzione riporta il numero di chilometri
percorsi in una settimana da 31 rappresentanti di commercio
di una nota marca di occhiali da sole .
Classi di
chilometri
[400 – 450)
[ 450 - 500)
[ 500 - 550)
[ 550 - 600)
[ 600 - 650)
totale
6
9
7
6
3
31
Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
7
A) Calcolare le frequenze relative, le frequenze
percentuali e le frequenze relative cumulate
B) Determinare il numero medio di chilometri
percorsi.
C) Calcolare la mediana e il primo quartile.
D) Misurare la variabilità della distribuzione
utilizzando la deviazione standard
8
Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
A) Calcolo delle frequenze relative, frequenze
percentuali e relative cumulate
6
f1   0,194
31
Classi di
chilometri
[400 – 450)
[ 450 - 500)
[ 500 - 550)
[ 550 - 600)
[ 600 - 650)
totale
9
f 2   0,290 
31
nj
6
9
7
6
3
31
fj
pj
0,194 19,4
0,290 29,0
0,226 22,6
0,194 19,4
0,097
9,7
1,000 100,0
Fj
0,194
0,484
0,710
0,903
1,000
Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
9
B) Calcolo della media aritmetica
Classi di
chilometri
x j  x j 1
[400 – 450)
[ 450 - 500)
[ 500 - 550)
[ 550 - 600)
[ 600 - 650)
totale
nj
6
9
7
6
3
31
cj*nj
Valore
centrale
classi (cj)
425
475
525
575
625
2.550
4.275
3.675
3.450
1.875
15.825
K
xa 
c n
j
j 1
n
j
15.825

 510,48
31
Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
10
C) Calcolo della mediana
1. Individuazione della classe mediana
Classi di
chilometri
nj
[400 – 450)
[ 450 - 500)
[ 500 - 550)
[ 550 - 600)
[ 600 - 650)
totale
6
9
7
6
3
31
n  1 31  1
rango mediana 

 16
2
2
Fj
Nj
6
15
22
28
31
0,194
0,484
0,710
0,903
1,000
La mediana è
contenuta nella
classe 500-550
11
C) Calcolo della mediana
2. Individuazione della mediana nella classe sotto l’ipotesi
di distribuzione uniforme (applicazione della formula)
 0,5  Fm1 
 m
Me  I m  
 Fm  Fm1 
Classi di
chilometri
nj
Nj
[400 – 450)
[ 450 - 500)
6
9
[ 500 - 550)
[ 550 - 600)
[ 600 - 650)
7
6
3
31
6 0,194
15 0,484
22 0,710
28 0,903
31 1,000
totale
Fj
Im=estr inf della classe
mediana=500
Fm-1=freq rel cum fino
alla classe precedente a
quella mediana =0,484
Fm=freq rel cum
fino alla classe
mediana=0,710
Δm=ampiezza della
classe mediana=
=550-500=50
 0,5  Fm1 
 0,5  0,484 
 m  500  
Me  I m  
  50  503,57
12
 0,710  0,484 
 Fm  Fm1 
Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
C) Calcolo del primo quartile
Q1 è il primo valore xi in corrispondenza del quale
la frequenza cumulata relativa Fj  0,25
Classi di
chilometri
nj
Fj
Nj
[400 – 450)
6
6
0,194
[ 450 - 500)
9
15
0,484
[ 500 - 550)
7
22
0,710
[ 550 - 600)
6
28
0,903
[ 600 - 650)
3
31
1,000
totale
31
 0, 25  FQ1 1 
 0, 25  0,194 
Q1  I Q1  


450

50  459, 72
 Q1


 FQ  FQ 1 
 0, 484  0,194 
1
 1

Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
13
D) Calcolo della deviazione standard
Classi di
chilometri
[400 – 450)
[ 450 - 500)
[ 500 - 550)
[ 550 - 600)
[ 600 - 650)
totale
xa  510,48
nj
Valore
centrale
classi
(cj)
6
9
7
6
3
31
(cj-μ)2
425 7306,8
475 1258,8
210,8
525
575 4162,8
625 13114,8
(cj-μ)2*nj
43840,8
11329,2
1475,6
24976,8
39344,4
120966,8
1 K
120966,8
2
   c j  x  nj 
 3902,15
n j1
31
2
  3902,15  62,47
14
Esercizio 3
Si consideri la seguente distribuzione di 100
imprese per classi di fatturato:
Classi di fatturato
(migliaia di euro)
N.
imprese
(0-20]
(20-50]
30
50
(50-100]
Totale
20
100
a) Rappresentare graficamente la distribuzione
b) Determinare la moda
Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
15
a) Costruzione dell’istogramma.
Le classi hanno diversa ampiezza. E’ necessario
calcolare la densità di frequenza
Classi di fatturato
(migliaia di euro)
nj
Ampiezza
classe
(aj)
Densità di
freq
(hj)
0-20
30
20
1,5
20-50
50
30
1,67
50-100
20
50
0,4
Totale
100
b) La classe modale è quella che ha la densità di frequenza
maggiore. Quindi la classe modale è 20-50
16
Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
ISTOGRAMMA
hi
1,7
1,5
0,4
0
20
50
100
17
Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
Esercizio 4
Si consideri la distribuzione degli alunni della scuola
secondaria di primo grado per giudizio riportato
all’esame di Stato nell’Anno scolastico 2006/07 in
Italia (dati Istat)
Giudizio
Licenziati
Sufficiente
37,1
Buono
26,4
Distinto
19,2
Ottimo
17,3
100,0
Determinare la moda e la mediana.
Misurare l’eterogeneità della distribuzione
18
Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
Si tratta di una distribuzione percentuale
Giudizio
Licenziati
Sufficiente
37,1
0,371
0,371
Buono
26,4
0,264
0,635
Distinto
19,2
0,192
0,827
Ottimo
17,3
0,173
1
100,0
1,000
Fj
fj
La moda, ossia la modalità più frequente è sufficiente
Per il calcolo della mediana sulla colonna delle
frequenze relative cumulate si individua la prima Fj
che è uguale o maggiore di 0,5
La mediana è Buono
19
Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
b) Eterogeneità della distribuzione
Giudizio
Licenziati
Sufficiente
37,1
0,371
0,1376
Buono
26,4
0,264
0,0697
Distinto
19,2
0,192
0,0369
Ottimo
17,3
0,173
0,0299
100,0
1,000
0,2741
f2j
fj
K
E1  1   f j2  1  0,2741  0,7259
j 1
0  E1 
K 1 3
  0,75
K
4
0,7259
e1 
 0,968
0,75
Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
20
Esercizio 1
Le retribuzioni, in migliaia di euro, di 5 dipendenti di un grande
magazzino risultano le seguenti:
10
20
28
8
14
a) Disegnare la curva di Lorenz;
b) Misurare la concentrazione.
21
Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
Per la distribuzione precedente è necessario ordinare innanzitutto le
intensità del carattere. Quindi si procede al calcolo di Fi e Qi
Retribuzioni
(valori
ordinati)
Intens. ass.
cum. Ai
Freq.
rel.
cum.
Fi
Intens.
rel. cum.
Qi
Fi - Qi
8
8
0,20
0,100 0,100
10
18
0,40
0,225 0,175
14
32
0,60
0,400 0,200
20
52
0,80
0,650 0,150
28
80
1,00
1,000
Fi 
i 3

n 5
Ai 32
Qi 

A n 80
22
Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
a) Curva di Lorenz
Qi
1,000
superficie di
concentrazione
0,650
0,400
0,225
0,100
0,2
0,4
0,6
0,8
1,0
Fi
n-1
b)
R
 (F  Q )
i 1
i
i
n 1
F
i 1
i
=
0, 625
=0,3125
2
Si è in presenza di una modesta concentrazione23
Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
Esercizio 2
Si consideri la seguente distribuzione delle industrie del legno per
classi di fatturato in migliaia e fatturato totale per classe
(milioni):
Classi di
fatturato
nJ
Fatturato
totale
0-5
750
1.930
5-10
420
3.260
10-25
390
6.350
25-50
180
5.450
Oltre 50
150
76.400
1.890
Determinare il rapporto di concentrazione.
24
Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
Per il calcolo dell’indice di concentrazione deve essere utilizzato il fatturato totale
che è noto (intensità)
Classi di
fatturato
nJ
Nj
Fatturato
totale
(intensità Aj)
Fi=
Nj/n
Qj=
Aj/AK
0-5
750 750
1.930
0,397
0,021
5-10
420 1170
5.190
0,619
0,056
10-25
390 1560
11.540
0,825
0,124
25-50
180 1740
16.990
0,921
0,182
Oltre 50
150 1890
93.390
1,000
1,000
1.890
25
Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
Quindi:
Classi di
fatturato
Fi=
Nj/n
Qj=
Aj/AK
Fj+1-Fj
Qj+1+Qj
(Fj+1-Fj)(Qj+1+Qj)
0-5
0,397
0,021
0,397
0,021
0,008
5-10
0,619
0,056
0,222
0,076
0,017
10-25
0,825
0,124
0,206
0,179
0,037
25-50
0,921
0,182
0,095
0,305
0,029
Oltre 50
1,000
1,000
0,079
1,182
0,094
0,185
R = 1 – 0,185 = 0,815
Elevata concentrazione del fatturato tra le imprese
26
Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
Esercizio 3
Si consideri la seguente distribuzione delle famiglie per classi
di reddito mensile in migliaia di euro
Classi di
reddito
Famiglie
nj
0-2
2
2-6
4
6-8
3
8-10
1
10
A) Disegnare la curva di Lorenz
B) Misurare la concentrazione del reddito
27
Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
Classi
nJ
cj
Nj
Fi=
Nj/n
Aj
cj*nj
Qj=
Aj/AK
0-2
1
2
2
0,2
2
2-6
4
4
6
0,6
16
18 18/48=0,375
6-8
7
3
9
0,9
21
39 39/48=0,813
8-10
9
1
10
1,0
9
48 48/48=1,000
10
2 2/48=0,042
48
1,000
Qi
superficie di
concentrazione
0,813
0,375
Pi
0,042
0,2
28
0,6
0,9 1,0
Classi
Fi=
Nj/n
Qj=
Aj/AK
(Fj+1- Fj)
(Qj+1+Qj)
(Fj+1Fj)(Qj+1+Qj)
0-2
0,2 0,042
0,2
0,042
0,0084
2-6
0,6 0,375
0,4
0,417
0,1668
6-8
0,9 0,813
0,3
1,188
0,3564
8-10
1,0 1,000
0,1
1,813
0,1813
k 1
R  1   F j 1  F j Q j 1  Q j   1  0,7129 
j 0
R  0,2871
Modesta concentrazione
29
Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
Esercizio 4
Si consideri la seguente distribuzione di 20 imprese secondo il
numero di addetti:
Addetti
N. imprese
1
10
3
5
5
3
10
2
20
Misurare l’asimmetria della distribuzione
30
Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
Si può procedere ad una rappresentazione grafica per valutare il grado di
simmetria della distribuzione
Imprese secondo il numero di addetti
12
10
8
6
4
2
0
1
3
5
10
31
Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
Addetti
x
NJ
N. imprese
j  X
 x
3
j
X
1
10
10
-8
-80
3
5
15
0
0
5
3
18
8
24
10
2
20
343
686
  2,74
 
M3
3
j
630
20
X 3
n
3
Mo  1
Me  1
630 20

 1, 531
20,571
La distribuzione è asimmetrica positiva
Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
32
Indagine Bankitalia sul reddito delle famiglie italiane nel 2006
(tiene conto della composizione
demografica della famiglia)
entrambe le distribuzioni sono
asimmetriche positive
33
Scarica