Corso di Laurea: Economia Aziendale
Insegnamento: Statistica
Docente: G.Latorre, D.Costanzo, M.Misuraca
Docente: G.Latorre, D.Costanzo, M.Misuraca
Lezione n° 08
1 – La concentrazione
Nello studio dei fenomeni economici e sociali descritti attraverso caratteri quantitativi di tipo trasferibile può essere interessante analizzare la cosiddetta concentrazione
E’ trasferibile quel carattere la cui intensità globale o una sua parte è attribuibile (anche solo idealmente) ad una o ad un certo numero di unità del collettivo oggetto di studio:
Caratteri trasferibili
Caratteri non trasferibili
Reddito
R
ddit
Quote di mercato
Quote di produzione
Rischio commerciale (fatturato)
(
)
…
Età
Altezza
Peso
Componenti del nucleo familiare
p
…
Se i valori della variabile sono livelli raggiungibili da qualsiasi unità ed ha un senso la loro
Se
i valori della variabile sono livelli raggiungibili da qualsiasi unità ed ha un senso la loro
somma o aggregazione allora lo studio di concentrazione è plausibile
Corso di Laurea: Economia Aziendale
Insegnamento: Statistica
Docente: G.Latorre, D.Costanzo, M.Misuraca
Docente: G.Latorre, D.Costanzo, M.Misuraca
Lezione n° 08
2 – Trasferibilità dei caratteri
Data una distribuzione unitaria di n osservazioni di un carattere X ordinati in senso crescente
Data una distribuzione unitaria di n osservazioni di un carattere X, ordinati in senso crescente
x1 ≤ x 2 ≤ ... ≤ xn
si è interessati a studiare come l’ammontare totale del carattere
n
A=∑ x i
i=1
sia ripartito fra le diverse unità statistiche che compongono il collettivo:
(1) equidistribuzione
ciascuna delle n unità possiede 1/n dell’ammontare complessivo A del carattere, ossia:
x i = A n =x
(2) massima concentrazione
ll’intero
intero ammontare del carattere è posseduto da una unità:
ammontare del carattere è posseduto da una unità:
x 1 = x 2 =...=x n‐1 =0
x n =A=n x
Corso di Laurea: Economia Aziendale
Insegnamento: Statistica
Docente: G.Latorre, D.Costanzo, M.Misuraca
Docente: G.Latorre, D.Costanzo, M.Misuraca
Lezione n° 08
3 – Definizioni preliminari
Si consideri un carattere (trasferibile) X osservato su un collettivo di N unità statistiche e Si
consideri un carattere (trasferibile) X osservato su un collettivo di N unità statistiche e
siano queste ordinate secondo l’ammontare posseduto
Indichiamo con pi la frequenza relativa cumulata delle prime i
Indichiamo con p
la frequenza relativa cumulata delle prime i unità
i
pi =
n
Allo stesso modo, dato l’ammontare A, indichiamo con qi la frazione cumulata del carattere posseduto dalle prime i unità
Ai
qi = con Ai =A1 +A2 +A3 +...+Ai
A
Si dimostra che per ogni unità del collettivo vale la relazione
pi ≥ qi
Corso di Laurea: Economia Aziendale
Insegnamento: Statistica
Docente: G.Latorre, D.Costanzo, M.Misuraca
Docente: G.Latorre, D.Costanzo, M.Misuraca
Lezione n° 08
4 – Misurare la concentrazione
Per misurare la concentrazione di un carattere X in un collettivo è necessario considerare gli Per
misurare la concentrazione di un carattere X in un collettivo è necessario considerare gli
scarti (differenze) tra frequenze relative cumulate delle unità statistiche e frazione cumulata dell’ammontare di carattere posseduto:
c i =(p i ‐qi )
La concentrazione totale nel collettivo è ottenuta sommando gli scarti
N‐1
( ‐q )
∑ (p
i
i
i=1
(1) quando si ha minima concentrazione (EQUIDISTRIBUZIONE) la somma è pari a 0
N‐1
( ) quando si ha massima concentrazione allora la somma è pari a
(2)
d
h
ll
l
è
∑p
i=1
i
Corso di Laurea: Economia Aziendale
Insegnamento: Statistica
Docente: G.Latorre, D.Costanzo, M.Misuraca
Docente: G.Latorre, D.Costanzo, M.Misuraca
5 – Costruire un indice normalizzato
Lezione n° 08
IIn statistica spesso abbiamo l’esigenza di costruire indici che consentano un confronto tra le t ti ti
bbi
l’ i
di
t i i di i h
t
f t t l
modalità di una distribuzione o tra distribuzioni diverse prescindendo dall’unità di misura del carattere studiato
Per ottenere un indice che varia tra 0 e 1 e può essere espresso in percentuale si usa dividere il valore dell’indice per il valore massimo che l’indice stesso può assumere:
ESEMPIO
ni = numero di unità statistiche che presentano la i‐esima modalità
fi = numero di unità statistiche che presentano la i‐esima modalità in
rapporto alla dimensione del collettivo
In generale l’indice ottenuto come rapporto tra il valore osservato e il massimo valore che si poteva osservare rispetto al fenomeno studiato è detto INDICE NORMALIZZATO
N.B.: la misura è influenzata dalle ipotesi iniziali assunte per calcolare il massimo dell’indice
Corso di Laurea: Economia Aziendale
Insegnamento: Statistica
Docente: G.Latorre, D.Costanzo, M.Misuraca
Docente: G.Latorre, D.Costanzo, M.Misuraca
Lezione n° 08
6 – L’indice di Gini
Per misurare la concentrazione di un carattere in un collettivo è possibile utilizzare un indice P
i
l
t i
di
tt
i
ll tti è
ibil tili
i di
normalizzato noto come rapporto di concentrazione di Gini
n‐1
n‐1
∑ (p ‐q )
i
R
R=
i=1
i=1
i
=1‐
1
n‐1
∑p
∑q
i
i
i=1
n‐1
∑p
i
i=1
se R=0
se R=0
equidistribuzione
se R=1
max concentrazione
Si esprime in percentuale: un valore k compreso tra 0 e 1 indica un livello di concentrazione pari al k% di quella massima osservabile nella distribuzione del carattere studiato
Corso di Laurea: Economia Aziendale
Insegnamento: Statistica
Docente: G.Latorre, D.Costanzo, M.Misuraca
Docente: G.Latorre, D.Costanzo, M.Misuraca
7 – Regole di lettura dell’indice
Lezione n° 08
La lettura e l
La
lettura e l’interpretazione
interpretazione di un indice è semplice ma spesso risulta difficile esprimerlo in modo di un indice è semplice ma spesso risulta difficile esprimerlo in modo
chiaro e univocamente comprensibile
In generale abbiamo visto come per R=0 si possa dire che “non c’è concentrazione” oppure che
“ ’è
“c’è equidistribuzione”
idi t ib i
” del carattere studiato nel collettivo; allo stesso modo per R=1 si può dire d l
tt
t di t
l ll tti
ll t
d
R 1 i ò di
che “c’è massima concentrazione”
Quando l’indice R è compreso tra 0 e 1 allora la quantità ottenuta può essere letta in termini percentuali rispetto a quella massima osservabile in quel collettivo per quel carattere:
‐ da 0 a 0,25 la concentrazione è bassa
(es. R=0,18 ‐> 18% della max concentrazione osservabile, quindi si ha una bassa concentrazione)
‐ da 0,25 a 0,5 la concentrazione è medio‐bassa
(es. R=0,36 ‐> 36% della max concentrazione osservabile, quindi si ha una concentrazione medio‐bassa)
‐ per R=0,5 si ha una media concentrazione
per R 0 5 si ha una media concentra ione
‐ da 0,5 a 0,75 la concentrazione è medio‐alta
(es. R=0,69 ‐> 69% della max concentrazione osservabile, quindi si ha una concentrazione medio‐alta)
‐ da 0,75 a 1 la concentrazione è alta
(es. R=0,83 ‐> 83% della max concentrazione osservabile, quindi si ha una alta concentrazione)
Corso di Laurea: Economia Aziendale
Insegnamento: Statistica
Docente: G.Latorre, D.Costanzo, M.Misuraca
Docente: G.Latorre, D.Costanzo, M.Misuraca
Lezione n° 08
8 – Uno schema per il calcolo
unità
X
pi
Ai
qi
pi ‐ qi
1
x1
1/n
A1
A1/An
p1 – q1
2
x2
2/n
A2
A2/An
p2 – q2
3
x3
3/n
A3
A3/An
p3 – q3
…
…
…
…
…
…
i
xi
i/n
Ai
Ai/An
pi ‐ qi
…
…
…
…
…
…
n
xn
1
An
1
0
Ordinate
i
in senso crescente
Per procedere da un punto di d
d
di
vista operativo allo studio della concentrazione è conveniente organizzare i dati secondo la tabella riportata di fianco
n ‐1
∑ (p ‐q )
i
R=
i
Totale dell’ultima colonna fino alla penultima riga
i= 1
n ‐1
∑p
i= 1
i
Totale della terza colonna fino alla penultima riga
Corso di Laurea: Economia Aziendale
Insegnamento: Statistica
Docente: G.Latorre, D.Costanzo, M.Misuraca
Docente: G.Latorre, D.Costanzo, M.Misuraca
Lezione n° 08
9 – Esempio
Emittenti televisive
Vogliamo studiare la concentrazione dei ricavi derivanti dalla pubblicità di un collettivo di emittenti private operanti in una
operanti in una certa Regione
Introiti pubblicitari
Tele Noi
TV9
Rete Beta
Telesuper
Canale 20
Noia TV
Tele Bella
Onda Sud
TV Maxi
3390
4610
6970
13200
15240
17980
18570
18890
19940
TOTALE: 118790
i
pi
1
2
3
4
5
6
7
8
9
0,111
0,222
0,333
0,444
0,556
0,667
0,778
0,889
1
Ai
qi
3390 0,029
8000 0,067
14970 0,126
28170 0,237
43410 0,365
61390 0,517
79960 0,673
98850 0,832
118790 1
n‐1
n
1
∑ (p ‐q )
i
R=
i=1
n‐1
n
1
∑ pi
i=1
i
=0,288 → 29%
La concentrazione degli introiti pubblicitari è pari al 29% di quella massima osservabile
C’è un basso livello di concentrazione
Corso di Laurea: Economia Aziendale
Insegnamento: Statistica
Docente: G.Latorre, D.Costanzo, M.Misuraca
Docente: G.Latorre, D.Costanzo, M.Misuraca
Lezione n° 08
10 – Alcune considerazioni (1) La tabella rappresentata in basso riporta i redditi di una società in cui vivono cinque individui. A causa della rapida crescita economica, i redditi di tutti gli individui raddoppiano. In questa società
la disuguaglianza è aumentata, diminuita o invariata?
u.s.
xi
Ai
pi
qi
pi ‐ qi
1 200 200
2 450 650
3 550 1200
4 750 1950
5 1000 2950
0,2
0,4
0,6
0,8
1,0
0,068
0,220
0,407
0,661
1,000
0,132
0,180
0,193
0,139
0
u.s.
R= 0,322
xi
Ai
pi
1 400 400
2 900 1300
3 1100 2400
4 1500 3900
5 2000 5900
0,2
0,4
0,6
0,8
1,0
qi pi ‐ qi
0,068
0,220
0,407
0,661
1,000
0,132
0,180
0,193
0,139
0
R= 0,322
Quindi se applichiamo una trasformazione del tipo aX al carattere studiato manteniamo lo stesso livello di concentrazione, come dimostrato dall’esempio
Cosa accade se invece applichiamo una trasformazione del tipo X+b al carattere?
Proviamo ad aggiungere a tutte le unità 500, 1000 e 2000€: cosa accade al livello di concentrazione del reddito?
Corso di Laurea: Economia Aziendale
Insegnamento: Statistica
Docente: G.Latorre, D.Costanzo, M.Misuraca
Docente: G.Latorre, D.Costanzo, M.Misuraca
Lezione n° 08
11 – Alcune considerazioni (2) u.s. xi Ai
1 200 200
2 450 650
3 550 1200
4 750 1950
5 1000 2950
pi
0,20
0,40
0,60
0 80
0,80
1,00
qi 0,068
0,220
0,407
0 661
0,661
1,000
pi ‐ qi 0,132
0,180
0,193
0 139
0,139
0,000
+500
1 700 700
2 950 1650
3 1050 2700
4 1250 3950
5 1500 5450
0,20
0 40
0,40
0,60
0,80
1,00
0,128
0 303
0,303
0,495
0,725
1,000
0,072
0 097
0,097
0,105
0,075
0,000
R = 0,174
(17%)
+1000
1
2
3
4
5
0,20
0,40
0,60
0,80
1,00
0,151
0,333
0,528
0,748
1,000
0,049
0,067
0,072
0,052
0,000
R = 0,119
(12%)
+2000
1
2
3
4
5
1200
1450
1550
1750
2000
1200
2650
4200
5950
7950
2700 2700
2950 5650
3050 8700
3250 11950
3500 15450
0,20
0.40
0,60
0,80
1,00
0,175
0,366
0,563
0,773
1,000
0,025
0,034
0,037
0,027
0,000
R = 0,322
(32%)
La concentrazione non è invariante per trasformazioni del tipo X+b
Se il reddito di ciascun individuo aumenta in modo proporzionale la concentrazione non cambia, ma se il reddito cresce della stessa quantità allora la concentrazione risulterà à ll
l
l à
inferiore, perché è come se il reddito di ogni unità “si avvicinasse” a quello degli altri…
Infatti la frazione di reddito posseduta dalle diverse unità risulta essere:
u.s.
R = 0,061
(6%)
1
2
3
4
5
0,068
0,153
0,186
0,254
0,339
+500
+1000
+2000
0,128
0,174
0,193
0,229
0,275
0,151
0,182
0,195
0,220
0,252
0,175
0,191
0,197
0,210
0,227
Corso di Laurea: Economia Aziendale
Insegnamento: Statistica
Docente: G.Latorre, D.Costanzo, M.Misuraca
Docente: G.Latorre, D.Costanzo, M.Misuraca
12 – Rappresentazione grafica della concentrazione Lezione n° 08
Con le coppie (p
C
l
i ( i , qi) è possibile realizzare una rappresentazione grafica della concentrazione )è
ibil
li
t i
fi d ll
t i
detto Curva di Lorenz
Frazione cumulata
del carattere
Frequenza cumulata
delle unità
Maggiore è l’area tra la bisettrice e la curva maggiore è il livello della concentrazione
Corso di Laurea: Economia Aziendale
Insegnamento: Statistica
Docente: G.Latorre, D.Costanzo, M.Misuraca
Docente: G.Latorre, D.Costanzo, M.Misuraca
Lezione n° 08
13 – Esempio
qi
1
Il valore di R esprime l’area compresa tra la spezzata di concentrazione e la
tra la spezzata di concentrazione e la linea di equidistribuzione: più piccolo
è R (fino a 0) più la spezzata si avvicina alla linea più grande è R (fino a 1) più
alla linea, più grande è R (fino a 1) più la spezzata coincide con i cateti del triangolo (max concentrazione)
0.9
0.8
0.7
0.6
0.5
0.4
n‐1
0.3
∑ (p ‐q )
i
0.2
R=
0.1
0
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
pi
i
i=1
=0 228
=0,228
n‐1
∑p
i
i=1
Riprendendo l’esempio delle emittenti televisive si vede anche graficamente come ci sia una bassa concentrazione degli introiti pubblicitari
Corso di Laurea: Economia Aziendale
Insegnamento: Statistica
Docente: G.Latorre, D.Costanzo, M.Misuraca
Docente: G.Latorre, D.Costanzo, M.Misuraca
14 – Rapporto di Concentrazione e Curva di Lorenz
Lezione n° 08
Consideriamo il livello di concentrazione di un fenomeno in due collettivi (il primo è indicato con la linea blu, il secondo con la linea tratteggiata rossa)
qi
qi
A
B
pi
pi
Nel caso A possiamo dire che nel collettivo indicato con la linea blu il fenomeno è meno concentrato rispetto a quello indicato con la linea rossa
Nel caso B non riusciamo invece dall
Nel
caso B non riusciamo invece dall’analisi
analisi della Curva di Lorenz
della Curva di Lorenz a dare una risposta precisa: a dare una risposta precisa:
questo è uno dei limiti della rappresentazione grafica. Dobbiamo calcolare anche l’indice R per poter dire in quale collettivo il fenomeno è più o meno concentrato
Corso di Laurea: Economia Aziendale
Insegnamento: Statistica
Docente: G.Latorre, D.Costanzo, M.Misuraca
Docente: G.Latorre, D.Costanzo, M.Misuraca
Lezione n° 08
15 – Concentrazione per distribuzioni di frequenza
Consideriamo un carattere discreto con k modalità, e supponiamo di avere a disposizione il numero di unità statistiche sulle quali abbiamo osservato le diverse modalità
In questo caso per calcolare la concentrazione è più comodo utilizzare le seguenti espressioni:
h
Frequenza cumulata
delle unità
nh
ph =
n
∑xn
i i
qh =
i=1
k
∑xn
i i
i=1
P
Per misurare la concentrazione utilizziamo ancora una volta l’indice di Gini
i
l
i
ili i
l l’i di di Gi i
Frazione cumulata
del carattere
Corso di Laurea: Economia Aziendale
Insegnamento: Statistica
Docente: G.Latorre, D.Costanzo, M.Misuraca
Docente: G.Latorre, D.Costanzo, M.Misuraca
16 – Distribuzioni di frequenze in classi
Lezione n° 08
Nelle distribuzioni di frequenza e nelle distribuzioni in classi abbiamo una informazione in più: possiamo rilevare quante unità statistiche posseggono un certo ammontare di carattere
Nel caso di distribuzioni in classi per studiare la concentrazione dobbiamo considerare alcune ipotesi iniziali:
CASO A: se conosciamo l’ammontare di carattere posseduto e il numero di unità si assume che CASO
A: se conosciamo l’ammontare di carattere posseduto e il numero di unità si assume che
ci sia equidistribuzione (ogni unità della classe possiede lo stesso ammontare di carattere)
CASO B: se non conosciamo l’ammontare di carattere posseduto dalle unità della classe allora possiamo stimarlo moltiplicando il valore centrale per il numero di unità statistiche della classe
In tale situazione possiamo utilizzare la formula
k‐1
R ≅ 1‐∑( qi+1 + q
qi )(pi+1 ‐ p
pi ) ((k è il numero di classi))
i=0
Attenzione!!! In questo caso la sommatoria parte da i=0 Corso di Laurea: Economia Aziendale
Insegnamento: Statistica
Docente: G.Latorre, D.Costanzo, M.Misuraca
Docente: G.Latorre, D.Costanzo, M.Misuraca
Lezione n° 08
17 – Rappresentazione grafica
qi
B
1
0.9
L’area di max concentrazione (il triangolo OAB) è sempre pari a 1/2
0.8
0.7
L’area di concentrazione (indicata con R) si ottiene sottraendo alla max concentrazione
i
i trapezi e il triangolo (il primo da sinistra) i il i
l (il i
d i i
)
tracciati sotto la spezzata
0.6
0.5
R
0.4
0.3
Per approssimazione otteniamo la formula già Per
approssimazione otteniamo la formula già
vista in precedenza
0.2
0.1
A
0
O
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
pi
1 ⎡ p 1 q1 q1 +q2 (p 2 ‐p 1 )
q +q (p ‐p ) ⎤
‐⎢
+
+ + n‐1 n n n‐1 ⎥
+...+
n‐1
2 ⎣ 2
2
2
⎦
≅ 1‐ ∑ ( qi+1 + qi )(p i+1 ‐ p i )
R=
1
i=0
2
Corso di Laurea: Economia Aziendale
Insegnamento: Statistica
Docente: G.Latorre, D.Costanzo, M.Misuraca
Docente: G.Latorre, D.Costanzo, M.Misuraca
Lezione n° 08
18 – Esempio
classi imprese
p
0‐2
2043,0
3‐9
636,0
10‐19
103,2
20 49
20‐49
43 4
43,4
50‐99
11,8
100‐499
8,3
500‐999
0,8
,
2846,5
addetti
2718,3
2845,6
1352,0
1281 2
1281,2
808,7
1588,3
529,4
,
11123,5
Vogliamo studiare la concentrazione degli addetti nelle imprese di un certo settore: in questo caso si assume l’equidistribuzione
dell’ammontare
dell
ammontare di carattere per ogni classe (addetti per impresa)
di carattere per ogni classe (addetti per impresa)
classi imprese
pi
0‐2
2043,0
, 0,7177
,
0,7177
,
3‐9
636,0 0,2234 0,9412
10‐19
103,2 0,0363 0,9774
20‐49
43,4 0,0152 0,9927
50 99
50‐99
11 8 0,0041
11,8
0 0041 0,9968
0 9968
100‐499
8,3 0,0029 0,9997
500‐999
0,8 0,0003 1,0000
2846,5
1
Frequenza relativa
delle imprese
addetti
2718,3
,
2845,6
1352,0
1281,2
808 7
808,7
1588,3
529,4
11123,5
0,2444
,
0,2558
0,1215
0,1152
0 0727
0,0727
0,1428
0,0476
1
qi
0,2444
,
0,5002
0,6217
0,7369
0 8096
0,8096
0,9524
1,0000
( qi+1 + qi )(pi+1 ‐ pi )
Frazione relativa
degli addetti
0,1754
,
0,1664
0,0407
0,0207
0 0064
0,0064
0,0051
0,0005
0,4152
R ≅ 1 ‐ 0,4152= 0,5848
La concentrazione di addetti per impresa osservata, pari al 58% circa è medio‐alta
circa, è medio
alta
Corso di Laurea: Economia Aziendale
Insegnamento: Statistica
Docente: G.Latorre, D.Costanzo, M.Misuraca
Docente: G.Latorre, D.Costanzo, M.Misuraca
19 – Esercizi
((1))
Nella tabella di seguito sono riportati i redditi dichiarati (in €) per l’anno 2003 da alcuni parlamentari italiani
g
p
( )p
p
Studiare la concentrazione del reddito
((2))
Lezione n° 08
Nella tabella sono riportati i dati relativi agli spettatori dei primi 10 film della stagione 2003
p
g p
p
g
Studiare la concentrazione degli spettatori
Corso di Laurea: Economia Aziendale
Insegnamento: Statistica
Docente: G.Latorre, D.Costanzo, M.Misuraca
Docente: G.Latorre, D.Costanzo, M.Misuraca
20 – Esercizi
Lezione n° 08
È stata analizzata la quantità di ferro (in mg) contenuta in 84 campioni
di terreno A e 72 campioni di terreno B. I risultati sono riportati nella
seguente tabella in cui sono riportate le distribuzioni di frequenza e
seguente tabella in cui sono riportate le distribuzioni di frequenza e
l’ammontare di ferro per ogni classe:
TERRENO A
TERRENO B
quantità ferro (mg) n° campioni totale ferro (mg) n° campioni totale ferro (mg)
0 ‐| 5
15
20
8
40
5 ‐|| 15
5 15
18
108
8
112
15 ‐| 40
19
304
10
400
40 ‐| 60
12
600
25
1025
60 ‐| 70
6
390
15
975
70 ‐| 100
|
14
1260
6
426
Totale
84
2682
72
2978
Verificare in quale terreno il ferro è più concentrato