Corso di Statistica

annuncio pubblicitario
Corso di Statistica
Concentrazione
Prof.ssa T. Laureti
a.a. 2013-2014
Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
1
Concentrazione
Si studia la concentrazione come un aspetto
della variabilità di un carattere quantitativo
trasferibile (p.e. il reddito)
Concentrazione
C
i
nulla
ll → l’ammontare
l’
del
d l
carattere si distribuisce uniformemente tra le
unità
iàd
dell collettivo
ll i
Concentrazione massima → ll’intero
intero
ammontare del carattere è posseduto da una
sola unità
Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
2
Intensità media e intensità
complessiva
x1 x2 x3 … xn
osservazioni di un carattere X
quantitativo trasferibile (p.e. reddito)
ordinate
x1 ≤ x2 ≤ x3 ≤ … ≤ xn
n
μ = media di X
μ = x =
(p.e. reddito medio)
∑x
i =1
An = intensità complessiva di X
(p.e. reddito totale)
i
n
An =
n
∑x
i=1
i
= nμ
Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
3
Frequenze relative cumulate
La concentrazione si misura a partire da due
grandezze
Fi : frequenze
f eq en e relative
elati e cumulate
c m late
Qi : intensità relative cumulate
Per un insieme di n valori singoli
Fi =
cioè
i
n
i = 1,2,...n
F1 =
1
,
n
F2 =
2
,
n
...., Fn =
n
=1
n
Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
4
Intensità relative cumulate
Definendo
D
fi
d lle intensità
i t
ità assolute
l t cumulate
l t come
A1=x1
A2=x1+x2 (il reddito delle prime due unità)
…..
Ai=x1+x2+…+xi (il reddito delle prime i unità),
la generica intensità relativa cumulata Qi è data
da Q = A i , i = 1,2,..., n
i
cioè
An
Q1 =
A1
A
A
, Q2 = 2 , ... , Qn = n = 1
An
An
An
Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
5
Concentrazione dei ricavi
dell’azienda per punto vendita
Ricavi
(valori
ordinati)
)
Freq. rel.
cum. Fi
Intens.
ass. cum.
Ai
Intens. rel. cum.
Qi
X(1)=180
1/9=0,11
180
180/2925=0,06
X(2)=200
2/9=0,22
380
380/2925=0,13
X(3)=205
3/9=0,33
585
585/2925=0,20
X(4)=270
4/9=0,44
855
855/2925=0,29
X(5)=280
280
5/9 0 56
5/9=0,56
1135
1135/2925 0 39
1135/2925=0,39
X(6)=340
6/9=0,67
1475
1475/2925=0,50
X(7)=350
7/9=0 78
7/9=0,78
1825
1825/2925=0 62
1825/2925=0,62
X(8)=500
8/9=0,89
2325
2325/2925=0,79
600
X(9)=600
9/9=1
9/9
9 5
2925
9 5/ 9 5
2925/2925=1
∑ = 2925
Ogni punto
vendita pesa per
1/9 (11%) sul
totale dei punti
vendita
Il primo terzo
d i punti
dei
ti vendita
dit
(33%) realizza il
20% dei ricavi
totali
I primi due terzi
dei punti vendita
(67%)
realizzano il
50% dei ricavi
totali
Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
6
Concentrazione
Come misura del grado di concentrazione
consideriamo una funzione delle differenze Fi − Qi
per esempio la loro somma, ossia ∑ (Fi − Qi )
In particolare
⎧
⎪ 0
n−1
⎪
(
F
−
Q
)
=
⎨
∑
i
i
i=1
⎪n−1
Fi
⎪⎩∑
i=1
equidistribuzione
Ogni unità (che pesa
per 1/n in termini di
frequenze) detiene
esattamente una
frazione del carattere
pari a 1/n.
massima concentrazione
Q1 = Q2 = ... = Qn−1 = 0
Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
7
Rapporto di concentrazione
Un indice relativo di concentrazione è
n-1
definito da:
(F − Q )
R =
∑
i=1
i
i
n−1
∑F
i 1
i=
0≤R ≤1
i
rapporto di concentrazione di Gini
R=0 se c’è equidistribuzione
R=1
R
1 se c
c’è
è massima concentrazione
Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
8
Concentrazione dei ricavi
dell’azienda per punto vendita
Ricavi
(valori
ordinati)
)
Freq. rel.
cum. Fi
Intens.
rel. cum.
Qi
Fi - Qi
X(1)=180
0,11
0,06
0,05
X(2)=200
0,22
0,13
0,09
X(3)=205
0,33
0,20
0,13
X(4)=270
0,44
0,29
0,15
X(5)=280
280
0 56
0,56
0 39
0,39
0 17
0,17
X(6)=340
0,67
0,50
0,17
X(7)=350
0 78
0,78
0 62
0,62
0 16
0,16
X(8)=500
0,89
0,79
0,10
600
X(9)=600
1
1
0
n−1
∑ (F − Q ) = 1,02
i=1
i
n −1
∑F
i 1
i=
i
i
= 4 ,00
1,02
R=
= 0,255
4,00
Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
9
Concentrazione dei ricavi
dell’azienda per punto vendita
Il grado di concentrazione osservato non è
particolarmente alto.
p
Un elevato grado di concentrazione dei ricavi
aziendali
d l per punto vendita
d
è un ffattore di
d rischio,
h
in quanto i ricavi complessivi sono legati solo a
pochi punti vendita
vendita. In questa situazione è
sufficiente la chiusura di un punto vendita per
ridurre fortemente le vendite totali
Al contrario, un basso grado di concentrazione
indica che i ricavi complessivi sono distribuiti su
tuttii i puntii vendita.
di
Il rischio
i hi è b
basso
Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
10
Rappresentazione grafica
Q
Tutti i punti di
coordinate (Fi, Qi) si
ttrovano
o a oa
all’interno
te o del
de
quadrato di lato 1
(perché 0 ≤ Fi ≤ 1
e
0 ≤ Qi ≤ 1 )
1
0
1
F
Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
11
Rappresentazione grafica
Q
1
retta di equidistribuzione
Fi=Qi
45°
0
1
F
Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
12
Rappresentazione grafica
Q
1
Qi
0
Tutti i punti di
coordinate (Fi, Qi) si
trovano al di sotto
della retta a 45°
(perché Fi ≥ Qi )
(Fi,Qi)
Fi
1
F
Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
13
Rappresentazione grafica
Q
1
Fi
Qi
0
= Fi - Qi
((Fi,Qi)
Fi
1
F
Il grado
d di
concentrazione è tanto
maggiore quanto
maggiore è la distanza
verticale di ogni punto
dalla retta di
equidistribuzione
Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
14
Curva di Lorenz
Qi
1
Unendo tutti i
punti ((Fi, Qi) si
p
ottiene la curva di
Lorenz
(Fi,Q
Qi)
0
1
Fi
Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
15
Area di concentrazione
Qi
1
0
L’area compresa tra
L’
t la
l retta
tt
di equidistribuzione e la
curva di Lorenz si chiama
area di concentrazione
1
Fi
L’area è tanto più ampia
quanto maggiore è il
grado di concentrazione
Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
16
Concentrazione nulla
Qi
La curva di Lorenz
coincide con la retta
di equidistribuzione
L’area di
concentrazione è nulla
Fi
Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
17
Concentrazione massima
Qi
F
H
G
La curva di Lorenz
L
L
coincide con i cateti FG
e GH del triangolo
rettangolo
L’area di
concentrazione è
i
e parii a ½ (è
Fi massima
l’area del triangolo
rettangolo)
Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
18
Confronto tra due curve di
Lorenz
Qi
1
0
1
Fi
La curva rossa, più
vicina alla retta di
equidistribuzione,
equidistribuzione
segnala un grado di
concentrazione
inferiore a quello
corrispondente alla
curva blu
Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
19
Concentrazione per una
distrib. di freq. con classi di valori
Classi di
valori
Frequenze
Intensità
globali
(conosciute)
xj –| xj+1
nj
Xj
x1 –|| x2
x2 –| x3
…
xj –|| xj+1
…
xK –|| xK+1
n1
n2
X1
X2
nj
Xj
nK
XK
L’ammontare del
carattere detenuto
complessivamente
dalle nj unità
Ognuna d
O
delle
ll nj unità
ità
detiene un
ammontare del
carattere compreso
tra xj e xj+1
Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
20
E
Esempio:
i R
Reddito
ddit d
delle
ll ffamiglie
i li
(mgl.€)
Classi di
reddito
xj –|| xj+1
Numero
di
famiglie
nj
Intensità
fino a 20
20 –| 25
25 –|| 30
30 –| 35
35 –| 40
oltre 40
3
5
4
2
3
3
20
38
115
111
66
117
157
604
conosciute
Xj
Le tre famiglie della prima
classe hanno
complessivamente
l
un
reddito pari a 38 mgl. €
Ciascuna di loro ha un
reddito non superiore a 20
mgl.
g €.
Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
21
Calcolo di Fj
Per una distribuzione di frequenza,
Nj
Fj =
n
j = 1,2,...K
Nj sono le frequenze cumulate
F1 =
N1
,
n
F2 =
N2
,
n
...., FK =
NK
=1
n
Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
22
Calcolo di Qi
Definendo le intensità
à assolute cumulate come
A1=X1
…..
Aj=X1+X2+…+Xj
…..
AK=X1+X2+…+XK (ammontare complessivo del
carattere))
Aj
Qj =
,
j = 1,2,..., K
AK
cioè
A1
A2
AK
Q1 =
, Q2 =
, ... , QK =
=1
AK
AK
AK
Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
23
Esempio: Reddito delle famiglie
Classi di
reddito
xj –|| xj+1
fino a 20
20 –| 25
25 –|| 30
30 –| 35
35 –|| 40
oltre 40
Numero Intensità Freq. Fj=Nj/
di
cumul.
n
conosciute
famiglie
g
Xj
Nj
nj
3
5
4
2
3
3
20
38
115
111
66
117
157
604
3
8
12
14
17
20
0,15
0,40
0,60
,
0,70
0,85
1
Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
24
Esempio: Reddito delle famiglie
Classi di
reddito
xj –|| xj+1
Numero di
famiglie
nj
Intensità
Xj
Freq.
cumul.
Nj
Fi=
Nj/n
Intens.
cumul.
Aj
Qj=
Aj/AK
fino a 20
3
38
3
0,15
38
0,06
20 –|| 25
5
115
8
0,40
,
153
0,25
,
25 –| 30
4
111
12
0,60
264
0,44
30 –| 35
2
66
14
0,70
330
0,55
35 –| 40
3
117
17
0,85
447
0,74
oltre 40
3
157
20
1
604
1
20
604
conosciute
Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
25
Rappresentazione grafica
Qj
1
Q5
Q4
Q3
Q2
Q1
0
F1
F2 F3
F4 F5 1
Fj
Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
26
Spezzata di concentrazione
Qj
1
Q5
Q4
Q3
Q2
Q1
0
F1
F2 F3
F4 F5 1
Fj
Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
27
Area di concentrazione
Qj
1
A = Area di concentrazione
0 ≤ A ≤1 2
A
0
1
Fj
Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
28
Calcolo dell’area
dell area di concentrazione
Qj
H
L’area di
L’
concentrazione A si
può ottenere come
differenza tra l’area
dell’intero triangolo
FGH ((in rosso)) e…
A
Area del triangolo FGH =
F
G
Fj
Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
1
2
29
Calcolo dell’area
dell area di concentrazione
Qj
H
1
L area di concentrazione A
L’area
si può ottenere come
differenza tra l’area
dell’intero
dell
intero triangolo FGH
(in rosso) e…
…e l’area della figura in blu
A
F
G F
j
Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
30
Calcolo dell’area
dell area di concentrazione
Qj
1
Q5
Q4
L’area in blu è formata
da un triangolo e da
trapezi
Q3
Q2
Q1
0
F1
F2 F3 F4 F5 1
Fj
Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
31
Calcolo dell’area
dell area di concentrazione
Qj
1
Area del triangolo =
Q5
F1Q1
2
Q4
Q3
Q2
Q1
0
F1
F2 F3 F4 F5 1
Fj
Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
32
Calcolo dell’area
dell area di concentrazione
Qj
1
A
Area
del
d l primo
i
trapezio
t
i =
Q5
=
Q4
(Q2 + Q1 )(F2 − F1 )
2
Q3
Q2
Q1
0
F1
F2 F3 F4 F5 1
Fj
Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
33
Calcolo dell’area
dell area di concentrazione
Qj
1
A
Area
del
d l secondo
d trapezio
t
i =
Q5
=
Q4
(Q3 + Q2 )(F3 − F2 )
2
Q3
Q2
Q1
0
F1
F2 F3 F4 F5 1
Fj
Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
34
Calcolo dell’area
dell area di concentrazione
Ponendo F0=0 e Q0=0,
1
l’area della figura
in blu si può
scrivere come
K −1
∑ (F
j o
j=
j+1
− Fj )(Q j+1 + Q j )
2
0
1
(per jj=0
0 si ottiene
l’area del triangolo,
per j=1 l’area del
primo trapezio,…)
trapezio )
Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
35
Area di concentrazione
Qj
1
K −1
1
A= −
2
A
0
1
∑ (F
j= 0
j+1
− Fj )(Q j+1 + Q j )
2
Fj
Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
36
Rapporto di concentrazione
Per avere un indice che varia tra 0 e 1, si
considera il doppio dell’area
R = 2A = 1 −
K −1
∑ (F
j= 0
j+1
− Fj )(Q j+1 + Q j )
0 ≤ R ≤1
R=0 → equidistribuzione
R=1 → massima concentrazione
Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
37
Esempio: Reddito delle famiglie
Fj
Qi
0,15
0,40
,
0,60
0,70
0,85
1
0,06
0,25
0,44
,
0,55
0,74
1
Fj+1-Fj Qj+1+Qj (Fj+1-Fj)(Qj+1+Qj)
0,15
0,25
0,20
,
0,10
0,15
0,15
0,06
0,31
0,69
,
0,99
1,29
1,74
0,009
0,078
0,138
,
0,099
0,194
0,261
Σ=0 779
Σ=0,779
R = 1 - 0,779 = 0,221
Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
38
Concentrazione per una
distrib. di freq. con classi di valori
Classi di
valori
Frequenze
Intensità
globali
(stimate)
xj –| xj+1
nj
x’jnj
x1 –|| x2
x2 –| x3
…
xj –| xj+1
…
xK –| xK+1
n1
n2
X1=x
=x’1n1
X2=x’2n2
nj
nK
Xj=x’j nj
XK=x
=x’KnK
x j + x j+1
x =
2
'
j
valore centrale
della classe
Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
39
Esempio:
Aziende per numero di addetti
Classi di
addetti
xj –| xj+1
1 –|| 5
5 –| 10
10 –|| 50
50 –| 100
100 –| 500
Numero Intensità
di
h
aziende
x’jnj
x
nj
9
10
18
27
2
66
27
75
540
2025
600
3267
Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
40
Esempio:
Aziende per numero di addetti
Classi di
addetti
xj –| xj+1
Numero
di
aziende
nj
1 –|| 5
9
10
18
27
2
66
5 –| 10
10 –| 50
50 –|| 100
00
100 –| 500
Intensità Freq. Fj=Nj/
h
cumul.
n
x’jnj
Nj
27
75
540
2025
600
3267
9
19
37
64
66
0,14
0
14
0,29
0,56
0 97
0,97
1
Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
41
Esempio:
Aziende per numero di addetti
Classi di
addetti
xj –| xj+1
1 –|| 5
5 –| 10
10 –| 50
50 –| 100
100 –| 500
Numero Intensità Freq.
di
h
cumul.
aziende
i d
x’jnj
Nj
nj
9
10
18
27
2
66
27
75
540
2025
600
3267
9
19
37
64
66
Fj=
Nj/n
Intensità
cumul.
Aj
Qj=
Aj/AK
0,14
0
14
0,29
0,56
0,97
1
27
102
642
2667
3267
0,01
0
01
0,03
0,20
0,82
1
Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
42
Esempio: Aziende per numero
di addetti
Fj
0,14
,
0,29
0 56
0,56
0,97
1
Qj Fj+1-Fj Qj+1+Qj (Fj+1-Fj)(Qj+1+Qj)
0,01
,
0,14
,
0,01
,
0,001
,
0,03 0,15
0,04
0,006
0 20 0,27
0,20
0 27
0 23
0,23
0 062
0,062
0,82 0,41
1,02
0,418
1
0,03
1,82
0,055
Σ=0,542
,
R = 1 - 0,542 = 0,458
Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
43
Un’applicazione dell’ Indice di Gini: Disuguaglianza dei
redditi in Italia
Diseguaglianza dei redditi per regione
(Indice di concentrazione di Gini sui redditi netti familiari esclusi i fitti
imputati) Anno 2009
Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
Diseguaglianza dei redditi nei paesi Ue (Indice di concentrazione di Gini sui
redditi netti familiari esclusi i fitti imputati)
Anno 2009
Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti
Scarica