Statistica economica
Capitolo 4
Prof. Alessandra Michelangeli
a.a. 2013-2014
Argomenti della quarta settimana di lezione
Sintesi della distribuzione di un carattere
Indici di variabilità
•
•
•
•
•
•
•
•
•
•
La variabilità di una distribuzione
Indici basati sullo scostamento dalla media
Teorema di Chebyshev
Teorema di Markov
Intervalli di variazione
Box-plot
Asimmetria
Standardizzazione
Concentrazione
Omogeneità/Eterogeneità
Statistica economica a.a. 2013/2014
2
Variabilità di una distribuzione: esempio 1
Consideriamo una popolazione di 4 individui che chiameremo la
popolazione A. Il carattere statistico di interesse è il numero di titoli
azionari detenuti in portafoglio da ogni individuo. La distribuzione
unitaria è riportata nella prima tabella mentre la seconda tabella riporta la
distribuzione unitaria per una seconda popolazione che chiameremo
popolazione B.
Popolazione B
Popolazione A
Unità statistica
# titoli azionari
Unità statistica
# titoli azionari
Individuo 1
0
Individuo 5
8
Individuo 2
8
Individuo 6
9
Individuo 3
12
Individuo 7
11
20
Individuo 8
12
Individuo 4
Calcoliamo la media. Che cosa possiamo dire sulla variabilità delle due distribuzioni?
Statistica economica a.a. 2013/2014
3
Variabilità di una distribuzione
• La variabilità di una distribuzione esprime la tendenza delle unità
di una popolazione statistica ad assumere diverse modalità del
carattere.
Statistica economica a.a. 2013/2014
4
Requisiti fondamentali degli indici di variabilità
1) Un indice di variabilità deve assumere il suo valore minimo se
e solo se tutte le unità della distribuzione presentano uguale
modalità del carattere.
2) Un indice di variabilità deve aumentare all’aumentare della
“diversità” tra le modalità assunte dalle varie unità.
N.B. Poiché stiamo considerando caratteri quantitativi, la diversità tra le
modalità viene misurata considerando o il valore assoluto o il quadrato
della differenza tra le modalità o tra la singola modalità e la media. In
questo modo, ogni “diversità” incrementa il valore dell’indice.
5
Statistica economica a.a. 2013/2014
Indici basati sullo scostamento dalla
media aritmetica
• Un indice basato sugli scostamenti dalla media aritmetica è la
varianza.
• La varianza di n valori x1 , x2 ,..., xn
di una variabile
X con media aritmetica x è
σ2 =
n
1
(xi − x )2
∑
n i =1
n
• Il numeratore è chiamato devianza:
∑ ( xi
Formula 1 per
distribuzione
unitaria
− x )2
i =1
Statistica economica a.a. 2013/2014
6
Formula della varianza
per distribuzioni di frequenze relative o percentuali
• Data la distribuzione di frequenze di una variabile X con K
modalità, la varianza è data da:
K
2
2
1K
σ = ∑nj ( xj − x ) = ∑ f j ( xj − x )
n j=1
j=1
2
Formula 2 per
distribuzione di
frequenze relative
K
2
2
1K
1 K
σ = ∑n j x j − x = ∑ f j x j − x = ∑ p j x j − x
100 j =1
n j =1
j =1
(
2
)
(
)
(
)
2
Formula 3 per
distribuzione di
frequenze percentuali
Statistica economica a.a. 2013/2014
7
Calcolo della varianza secondo la formula 1
Popolazione A
Unità statistica
# titoli azionari
Individuo 1
0
Individuo 2
8
Individuo 3
12
Individuo 4
20
1
xa =
n
σ2 =
4
∑
i =1
xi =
Distribuzione
unitaria
0 + 8 + 12 + 20
= 10
4
1n
1
1
2
2
2
2
2
( xi − x) = ( 0−10) +(8−10) +(12−10) +( 20−10)  = ⋅ 208 = 52
∑
n i=1
4
4
Statistica economica a.a. 2013/2014
8
Calcolo della varianza secondo la formula 1
Unità statistica
Tasso di crescita
(ahimé negativo) del
PIL, anno 2012
Tasso (%)
Grecia
-6,7
Italia
-2,6
Portogallo
-1,5
Spagna
-1,8
xa =
σ2 =
1 n
2
∑( xi − x ) =
n i =1
1
n
4
∑x
i =1
i
=
− 6, 7 − 2, 6 − 1, 5 − 1, 8
= − 3,1 5
4
1
2
2
2
2
= ( −6,7 − (−3,15) ) + ( −2,6 − (−3,15) ) + ( −1,5 − (−3,15) ) + ( −1,8 − (−3,15) )  =

4
1
= ⋅17,44 = 4,36
4
Statistica economica a.a. 2013/2014
9
Calcolo della varianza
per la distribuzione del numero di agenti inquinanti nell’atmosfera
Statistica economica a.a. 2013/2014
10
• La varianza si può anche calcolare usando questa formula:
σ2 =
1 n 2
xi − (x )2
∑
n i =1
Formula 1/bis per
distribuzione
unitaria
• La varianza corrisponde quindi alla differenza tra il momento secondo e il momento
primo al quadrato.
11
Statistica economica a.a. 2013/2014
• Data
σ2 =
la distribuzione di frequenze di una variabile X con K
modalità, la formula della
varianza diventa:
K
1 K
2
2
n
x
−
.
x
=
f j x2j − x 2
∑
∑
j j
n j =1
j =1
Formula 2/bis per
distribuzione di
frequenze relative
K
1 K
1 K
2
2
2
2
σ = ∑ n j x j − .x = ∑ f j x j − x =
p j x 2j − .x 2
∑
n j =1
100 j =1
j =1
2
Statistica economica a.a. 2013/2014
Formula 3/bis per
distribuzione di
frequenze
percentuali
12
Calcolo della varianza
per la distribuzione del numero di agenti inquinanti nell’atmosfera
usando la formula 2/bis
X
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
xj ²
fj
xj²*fj
1
4
9
16
25
36
49
64
81
100
121
144
169
196
225
0,0097
0,0097
0,0388
0,0583
0,0874
0,1165
0,1165
0,1456
0,2233
0,0583
0,0583
0,0388
0,0291
0,0000
0,0097
0,0097
0,0388
0,3492
0,9328
2,1850
4,1940
5,7085
9,3184
18,0873
5,8300
7,0543
5,5872
4,9179
0,0000
2,1825
66,40
Corrisponde al quadrato
della media aritmetica.
La media aritmetica si chiama
anche momento primo, che viene
elevato al quadrato nella formula
alternativa di calcolo della varianza
-
59,57
=
6,82
13
Statistica economica a.a. 2013/2014
Calcolo della varianza
per la distribuzione del numero di abitanti in 103 città italiane.
Le modalità sono state suddivise in classi
cj
pj
25
xa =
1
1 00
4
∑c
j
⋅ p j = 24 4,17 4
j =1
18,45
75
39,41
σ2 =
1 4
∑ p j x2j − x 2 =
100 j =1
1 
2
2
2
2
18, 45 ⋅ ( 25 ) + 39, 41 ⋅ ( 75 ) + 35,92 ( 300 ) + 5,83 ⋅ (1750 )  − (244,174) 2 =

100 
= 153582,93
=
σ
2
=
300
35,92
1750
5,83
1
100
4
∑
2
p j (xj − x ) =
j =1
1 
2
2
2
2
18, 45 ⋅ ( 25 − 244,174 ) + 39, 41 ⋅ ( 75 − 244,174 ) + 35, 92 ( 300 − 244,174 ) + 5, 83 ⋅ (1750 − 244,174 )  =

100 
= 153457, 36
=
Statistica economica a.a. 2013/2014
14
La varianza di un carattere Y ottenuto dalla trasformazione Y
di un carattere X con media
x
e varianza
σ2
= αX + β
è:
Var (Y ) = α 2σ 2
15
Statistica economica a.a. 2013/2014
• La varianza non possiede la stessa unità di misura dei valori della
distribuzione.
• La deviazione standard (o scarto quadratico medio) ha la stessa
unità di misura della variabile considerata.
σ = σ2
• Come per la varianza, maggiore è la variabilità delle modalità del
carattere assunte dalle unità statistiche, maggiore è la deviazione
standard.
• Se le unità statistiche possiedono tutte la stessa modalità, la
deviazione standard e la varianza avranno valore nullo.
Statistica economica a.a. 2013/2014
16
Calcolo della varianza e dello scarto quadratico medio
per la distribuzione del numero di abitanti in 103 città italiane.
Le modalità sono state suddivise in classi
cj
pj
25
xa =
1
1 00
4
∑c
j
⋅ p j = 24 4,17 4
j =1
18,45
75
39,41
σ2 =
1 4
∑ p j x2j − x 2 =
100 j =1
1 
2
2
2
2
18, 45 ⋅ ( 25 ) + 39, 41 ⋅ ( 75 ) + 35,92 ( 300 ) + 5,83 ⋅ (1750 )  − (244,174) 2 =

100 
= 153582,93
=
σ
2
=
300
35,92
1750
5,83
1
100
4
∑
σ =
σ
2
= 391, 89
2
p j (xj − x ) =
j =1
1 
2
2
2
2
18, 45 ⋅ ( 25 − 244,174 ) + 39, 41 ⋅ ( 75 − 244,174 ) + 35, 92 ( 300 − 244,174 ) + 5, 83 ⋅ (1750 − 244,174 )  =

100 
= 153457, 36
=
σ =
σ
2
= 391, 74
Statistica economica a.a. 2013/2014
17
Indici di variabilità assoluti
Deviazione standard e varianza sono indici di variabilità assoluti
con la stessa unità di misura (elevata al quadrato per la varianza)
del carattere statistico.
Non è quindi possibile eseguire confronti tra la variabilità di
caratteri che hanno unità di misure diverse come, per esempio,
centimetri e grammi.
Non è nemmeno corretto eseguire confronti tra la variabilità di
due caratteri con la stessa unità di misura (per esempio i kg) ma
osservati in due collettivi caratterizzati da ordini di grandezza
diversi (per esempio bambini e adulti).
Statistica economica a.a. 2013/2014
18
Coefficiente di variazione (CV)
Per confrontare la variabilità di due distribuzioni per il
carattere X con x > 0 può essere utilizzato il
coefficiente di variazione:
CV =
σ
x
100
• Se la media aritmetica è minore di zero, deve essere
considerata in valore assoluto.
Statistica economica a.a. 2013/2014
19
Il Coefficiente di variazione (CV) è
una misura della variabilità media di una distribuzione
intorno al suo valore medio. Si esprime in termini percentuali
in modo da poter confrontare la variabilità di più
distribuzioni riferite a caratteri statistici espressi in unità di
misura diverse.
Tuttavia, il Coefficiente di variazione si utilizza anche per
confrontare la variabilità di uno stesso carattere (quindi stessa
unità di misura), osservato su popolazioni statistiche diverse.
Statistica economica a.a. 2013/2014
20
Calcolo del coefficiente di variazione (CV)
Statistica economica a.a. 2013/2014
21
Calcolo del coefficiente di variazione (CV)
Statistica economica a.a. 2013/2014
22
Teorema di Chebyshev
Data una distribuzione di valori xi dei quali si conoscono
solo la media x e la deviazione standard σ e dato un valore
reale positivo k,
f ( xi − x ≥ k σ ) ≤
1
k2
Statistica economica a.a. 2013/2014
23
Applicazione del teorema di Chebyshev
Popolazione con statura media 170 cm e deviazione standard
uguale a 20 cm.
Qual è la frequenza relativa delle persone con statura superiore o
inferiore a 2 volteσ ?
x − 2σ
x
x + 2σ
130
170
210
• La
frequenza relativa non è superiore a 0,25 (25% in termini
percentuali).
Statistica economica a.a. 2013/2014
24
Considerazioni sul teorema di Chebyshev
La rilevanza del teorema di Chebyshev viene meno quando è
nota la distribuzione del carattere.
In questo caso, infatti, possiamo determinare con esattezza la
frequenza relativa delle unità statistiche esterne (o interne) ad un
determinato intervallo.
•
xj
1
3
8
9
15
nj
2
4
9
11
4
Per il teorema di Chebyshev non più del 44,4% delle unità cade
all’esterno dell’intervallo [2,68; 13,66]. In realtà è il 20% delle
osservazioni a cadere all’esterno.
Statistica economica a.a. 2013/2014
25
Il Teorema di Chebyshev è molto utile quando la distribuzione del carattere
X non è nota. Ma quando quest’ultima è conosciuta, allora è meglio usarla
direttamente senza ricorrere al teorema per determinare il valore esatto della
frequenza con cui le modalità cadono al di fuori di un dato intervallo
simmetrico intorno alla media aritmetica.
Statistica economica a.a. 2013/2014
26
Teorema di Markov
Data una variabile X che assume solo valori non negativi dei
quali è nota la media aritmetica , per un qualsiasi valore a>0
vale
f ( X ≥ a) ≤
x
a
Statistica economica a.a. 2013/2014
27
Applicazione del Teorema di Markov
Collettivo statistico: 200 bambini di età compresa tra 0 e 8
anni.
Carattere studiato: altezza misurata in cm.
Media aritmetica: 75,4 cm.
Qual è al massimo la frequenza dei bambini che hanno
un’altezza maggiore o uguale ai 140 cm?
f ( X ≥ 140 ) ≤
75, 4
= 0, 5385
140
Non più del 53,85% dei bambini osservati è alto 140 cm o di più.
Statistica economica a.a. 2013/2014
28
La standardizzazione
La standardizzazione è una particolare trasformazione
lineare che applicata ai dati originali riconduce qualsiasi
variabile X con media x e deviazione standard σx a una
nuova variabile con media nulla e varianza unitaria. Ogni
osservazione viene trasformata in un nuovo valore:
Attenzione, nel
manuale viene usata
la lettera y al posto di z.
zi =
xi − x
σ
La distribuzione risultante ha media nulla e varianza
unitaria.
29
Statistica economica a.a. 2013/2014
L’utilità della standardizzazione: un esempio
Due studenti della Scuola di Giurisprudenza della Bicocca,
Marco e Piero, sostengono, rispettivamente, l’esame di Diritto
costituzionale e di Diritto privato con i seguenti risultati:
Voto
Media dei voti conseguiti
nello stesso appello
Scarto quadratico
medio
Scarto quadratico
medio
Marco
28
26
2,1
0,95
Piero
26
21
2,6
1,92
Marco ha indubbiamente conseguito un voto più alto.
Tuttavia tenendo conto dell’andamento generale dei due
diversi appelli, Piero ha ottenuto un risultato migliore
rispetto a Marco.
Statistica economica a.a. 2013/2014
30
Statistica economica a.a. 2013/2014
31
Statistica economica a.a. 2013/2014
32
Statistica economica a.a. 2013/2014
33
Statistica economica a.a. 2013/2014
34
Intervalli di variazione (1)
• Noi studieremo due particolari intervalli di variazione: 1) il
range o campo di variazione e 2) il range interquartile o
differenza interquartile
• Campo di variazione
Dati n valori ordinati in senso crescente, x1 ≤ x2 ≤≤ xn ,
il campo di variazione è dato dalla differenza tra il valore
più grande e il valore più piccolo della distribuzione,
R = xn − x1
• Quando
il carattere è suddiviso in classi, il campo di
variazione viene calcolato come differenza tra l’estremo
superiore dell’ultima classe e l’estremo inferiore della prima
classe.
35
Statistica economica a.a. 2013/2014
Intervalli di variazione (2)
• Differenza interquartile
Dati n valori ordinati in senso crescente, x1 ≤ x2 ≤≤ xn ,
la differenza interquartile è data dalla differenza tra il
terzo e il primo quartile,
W = Q3 − Q1
• Ricordando
la definizione data dei quartili, possiamo
dire che la differenza interquartile rappresenta il campo
di variazione per il 50% delle unità centrali ovvero delle
unità più vicine alla mediana.
• La differenza interquartile non è influenzata dalla
presenza di valori anomali.
Statistica economica a.a. 2013/2014
36
Asimmetria
• Una distribuzione è asimmetrica se non è possibile individuare
un asse verticale che suddivide la distribuzione in due parti
specularmente uguali.
Una distribuzione di frequenze è simmetrica se:
n1 = nk , n2 = nk −1, n j = nk − j +1
Statistica economica a.a. 2013/2014
37
Box-plot
o
Scatola a baffi
Il box-plot è un grafico caratterizzato da tre elementi:
1) una linea o punto, che indicano la posizione della mediana
della distribuzione;
2) un rettangolo (box) la cui altezza indica la variabilità dei
valori “prossimi” alla mediana;
3) due segmenti che partono dal rettangolo e i cui estremi sono
determinati in base ai valori estremi della distribuzione.
In genere, come altezza del box, si considera la distanza
interquartile e come estremi dei due baffi il valore
minimo e massimo osservati. Inoltre, abbiamo sempre
evidenziato la media aritmetica attraverso una crocetta.
Statistica economica a.a. 2013/2014
38
Box-plot: esempio
N° atti aggressivi
1
2
3
4
5
6
7
8
9
10
frequenza
3
8
30
45
22
12
10
5
2
1
12
10
8
6
4
Max = 10
Min = 1
2
Q3=5
Q1=3
0
Valore mediano:
Me=4
Statistica economica a.a. 2013/2014
39
Ancora sull’asimmetria
Distribuzione con coda a destra o con
asimmetria positiva. La media aritmetica
sarà superiore alla mediana.
12
10
8
6
4
Max = 10
Min = 1
2
Q3=5
Q1=3
0
Valore mediano:
Me=4
Statistica economica a.a. 2013/2014
40
Carattere equidistribuito
Un carattere quantitativo trasferibile X , con n valori osservati,
x1 , x2 , , xn ,
è equidistribuito se ognuna delle n unità possiede 1/n
dell’ammontare complessivo del carattere, ovvero
1 n
xi = ∑xi = x.
n i=1
La somma di tutti gli n
valori viene indicata con
A dal manuale
Se il carattere non è equidistribuito, vi sarà un certo grado di
concentrazione del carattere che può essere misurato
tramite opportuni indici.
Statistica economica a.a. 2013/2014
41
Massima concentrazione
Si ha massima concentrazione quando l’intero
ammontare del carattere è posseduto da una sola
unità della polazione statistica, quindi:
x1 = x2 = ... = xn−1 = 0 e xn = A.
N.B. Non sempre sono realmente possibili i casi di
equidistribuzione e di massima concentrazione
(esempio del numero di addetti per impresa).
Statistica economica a.a. 2013/2014
42
Esempio: il caso del numero di addetti in 20 imprese
Popolazione statistica: 20 imprese
Carattere statistico: numero di addetti per impresa
Media aritmetica del carattere statistico: 6,5 addetti
E’ possibile una situazione di equidistribuzione?
NO ma possiamo immaginare una situazione prossima all’equidistribuzione
come, per esempio, 19 imprese che hanno 6 addetti e la ventesima impresa
che ne ha 16.
N.B. Il numero totale di addetti è 130 = 6,5·20
E’ possibile una situazione di massima concentrazione?
Statisticamente si: 19 imprese non hanno addetti e la 20esima ne ha 130,
ma nella realtà le imprese hanno bisogno di almeno un addetto per
svolgere la propria attività.
“Stabilito che in molti casi reali le situazioni di equidistribuzione e di massima
concentrazione non si possono verificare, considereremo queste come due situazioni ideali
di riferimento dalla quali la situazione osservata si può più o meno discostare” (Borra, Di
Ciaccio, p. 89).
43
Statistica economica a.a. 2013/2014
Relazione
concentrazione/variabilità
Tanto più un carattere è concentrato, tanto più
elevata è la variabilità del carattere.
Se il carattere non è variabile tra le unità statistiche
allora la concentrazione è nulla.
Statistica economica a.a. 2013/2014
44
Misure di concentrazione:
indice C
Consideriamo una carattere quantitativo trasferibile
X le cui modalità sono ordinate in senso non
decrescente.
Indice C
n−1
C = ∑(Fi − Qi ),
i=1
dove
45
Statistica economica a.a. 2013/2014
Esempio delle 9 emittenti radiofoniche per
misurare l’indice di concentrazione
Popolazione statistica: 9 emittenti radiofoniche, i = 1, …., n
Carattere statistico: introiti pubblicitari (in milioni di euro)
i/n
339
A1
x
=
= 1
11879
A
A
A2
x + x2
339 + 461
0, 07 =
=
= 1
11879
A
A
A3
x + x2 + x3
339 + 461 + 697
0 ,1 3 =
=
= 1
11879
A
A
0, 03 =
4
A4
339 + 461 + 697 + 1320
=
=
0, 24 =
A
11879
.
∑
xi
i=1
A
.
.
8
A8
3 3 9 + 4 6 1 + ... + 1 8 5 7 + 1 8 8 9
0,83 =
=
=
A
11879
1 =
A9
11879
=
=
11879
A
∑
A
xi
i=1
A
xi
i =1
9
A
Statistica economica a.a. 2013/2014
∑
46
Calcolo dell’indice C
n −1
C = ∑ ( Fi − Qi ) = (0,11 − 0,03) + (0, 22 − 0,07) + (0,33 − 0,13) +
i =1
+(0, 44 − 0, 24) + (0,56 − 0,37) + (0,67 − 0,52) + (0,78 − 0,67) +
+(0,89 − 0,83) = 1,18
47
Statistica economica a.a. 2013/2014
•Supponiamo ora che gli introiti pubblicitari siano
equidistribuiti tra le 9 emittenti radiofoniche
A = 11879 milioni di euro
11879
xi =
= 1319,88 milioni di euro
9
• L’indice C è uguale a zero perché
la concentrazione è nulla.
Statistica economica a.a. 2013/2014
48
•Supponiamo infine che 1 sola emittente concentri
l’intero ammontare degli introiti pubblicitari
n −1
C =
∑F
i
= 0,1 1 + 0, 2 2 + 0, 3 3 +
i =1
+ 0, 4 4 + 0, 5 6 + 0, 6 7 + 0, 7 8 +
+ 0, 8 9 = 4
49
Statistica economica a.a. 2013/2014
Misure di concentrazione:
rapporto di concentrazione di Gini
Consideriamo una carattere quantitativo trasferibile
X le cui modalità sono ordinate in senso non
decrescente.
Rapporto di concentrazione di Gini
n−1
1
R = n−1
∑F
∑(F − Q ).
i
i
i =1
i
i =1
Statistica economica a.a. 2013/2014
50
Tornando all’esempio delle emittenti radiofoniche
Rapporto di concentrazione di Gini
R=
n −1
1
n −1
∑F
∑ (F − Q ) =
i
i
i =1
1,18
= 0, 295
4
i
i =1
51
Statistica economica a.a. 2013/2014
Curva di Lorenz
Mediante le coppie Qi , Fi è possibile realizzare un
grafico chiamato curva di Lorenz
Statistica economica a.a. 2013/2014
52
Omogeneità ed eterogeneità
Si ha massima omogeneità quando tutte le unità della
popolazione statistica presentano la stessa modalità, per
esempio, la j-esima.
f1 = f2 =... = f j−1 = f j+1 =... = fk = 0 e f j =1
Si ha massima eterogeneità (o minima omogeneità)
quando tutte le modalità sono presenti con la stessa
frequenza nella popolazione statistica.
f1 = f2 =... = f j =... = fk =
1
k
Statistica economica a.a. 2013/2014
53
Omogeneità ed Eterogeneità: casi intermedi
• Un carattere tende a essere distribuito in maniera
omogenea se le unità statistiche assumono un numero
molto limitato di modalità.
• Un carattere tende a essere tanto più eterogeneo quanto
più le osservazioni tendono ad assumere diverse modalità
con frequenza quasi uguale.
Statistica economica a.a. 2013/2014
54
Indice di omogeneità
k
O1 = ∑
j =1
1 k 2
f = 2 ∑ nj
n j =1
2
j
O1 = 1 massima omogeneità
O1 =
1
minima omogeneità
k
1 1
1
1
1 1
+
+
...
+
+
...
+
=
k
⋅
=
k12 k22
k 2j
kk2
k2 k
N.B. k1 = k2 = ... = k j = ... = kk = k
55
Statistica economica a.a. 2013/2014
Indice di eterogeneità di Gini
k
E1 = 1 − O1 = 1 − ∑ f j2 = 1 −
j =1
1 k 2
∑ nj
n 2 j =1
E1 = 1 − 1 = 0 minima eterogeneità
E1 = 1 −
e1 =
1 k −1
=
massima eterogeneità
k
k
E1
k −1
k
Statistica economica a.a. 2013/2014
56
Applicazione dell’indice di omogeneità
Composizione della Camera: distinzione dei deputati per titolo di studio
Titolo di studio
(carattere statistico)
nj
Licenza media
11
Diploma di istruzione
secondaria superiore
186
Laurea breve o
diploma universitario
6
Laurea
427
O1 =
anno 2008; Fonte: Competenze parlamentari
4
1
1
− ∑ n 2j =
⋅ (112 + 186 2 + 6 2 + 427 2 ) = 0, 55
2
n
(630) 2
j =1
O1
0,25
0,55
1
minima omogeneità
max omogeneità
57
Statistica economica a.a. 2013/2014
Applicazione degli indici di eterogeneità
• Rivalutiamo ora la distribuzione precedente sul titolo dei deputati
alla Camera in termini di eterogeneità.
E1 = 1 − O1 = 1 − 0, 55 = 0, 45
e1 =
0, 45
= 0, 6
0, 75
Il grado di eterogeneità della
distribuzione corrisponde al 60% del
livello di eterogeneità massima
E1
0
minima eterogeneità
Statistica economica a.a. 2013/2014
0,45
0,75
max eterogeneità
58
Esercizio di riepilogo
Domanda 2 della prova d’esame del 18-6-2013
• La tabella seguente considera una popolazione statistica di 120
occupati secondo il settore di attività:
Settore
Industria
Commercio
Altro
nj
20
40
60
a) Calcolate l’indice di eterogeneità E1
b) Riproducete una seconda tabella in cui rappresentate il caso di
massima eterogeneità. Come andrebbero disposte le frequenze?
c) Riproducete una terza tabella in cui rappresentate un caso di
massima omogeneità.
Statistica economica a.a. 2013/2014
59
Case study di riepilogo:
distribuzione dei redditi in Italia
• Indice di concentrazione di Gini calcolato sui redditi familiari (dati
Banca d’Italia, Indagine sui redditi delle famiglie italiane):
•anno 1991: 28,2%;
• anno 2004: 33,7
• anno 2010: 35,1
• nel 2009: 29,1 in Germania e 24,1 in Svezia (dati Eurostat).
• “La ricchezza netta presenta una concentrazione maggiore di quella del
reddito: il 10% delle famiglie più ricche possiede il 45,9% dell’intera ricchezza
netta delle famiglie italiane (contro il 44,3% registrato nel 2008). L’indice di
Gini è pari al 62,4% nel 2010”. Da Banca d’Italia (2012), I bilanci delle famiglie italiane
nell’anno 2010, Supplementi al Bollettino Statistico, n.6
Statistica economica a.a. 2013/2014
60
Case study (continua)
Famiglie
Reddito
medio annuo
Quota %le
di reddito
Primo 10%
7.933
2,4
Dal 10 al 20%
13.738
4,2
Dal 20 al 30%
17.433
5,3
Dal 30 al 40%
21.100
6,4
Dal 40 al 50%
24.972
7,7
Dal 50 al 60%
29.500
9
Dal 60 al 70%
34.573
10,6
Dal 70 all’80%
41.252
12,6
Dall’80 al 90%
51.238
15,7
Dal 90 al 100%
85.511
26,1
Il primo 10% delle
famiglie, ordinate in
base al reddito, ha il
2,4% dei redditi
La quota di reddito
delle famiglie
appartenenti al 10°
decile corrisponde
circa alla somma dei
primi 5 decili
100
61
Riferimenti bibliografici e Homework
•
•
•
•
•
•
Capitolo 4 del Borra, Di Ciaccio.
Gli Scostamenti semplici medi (pp. 80 e 81) non sono in programma.
La definizione formale di valore anomali e valori eccedenti non è in
programma.
La terza formula per calcolare il Rapporto di concentrazione di Gini
alla fine di pagina 90 non è in programma. Anche gli argomenti
trattati a pag. 91 non rientrano nel programma di esame.
Gli indici di omogeneità ed eterogeneità che rientrano nel
programma di esame sono O1, E1 ed e1.
Svolgere esercizi 4.2, 4.6
(gli scostamenti semplici medi dalla media aritmetica e
dalla mediana nono sono da calcolare perché non sono in programma),
4.10, 4.13 a
pagina 101, 102 e 103 del Borra Di Ciaccio.
Statistica economica a.a. 2013/2014
62