Statistica economica Capitolo 4 Prof. Alessandra Michelangeli a.a. 2013-2014 Argomenti della quarta settimana di lezione Sintesi della distribuzione di un carattere Indici di variabilità • • • • • • • • • • La variabilità di una distribuzione Indici basati sullo scostamento dalla media Teorema di Chebyshev Teorema di Markov Intervalli di variazione Box-plot Asimmetria Standardizzazione Concentrazione Omogeneità/Eterogeneità Statistica economica a.a. 2013/2014 2 Variabilità di una distribuzione: esempio 1 Consideriamo una popolazione di 4 individui che chiameremo la popolazione A. Il carattere statistico di interesse è il numero di titoli azionari detenuti in portafoglio da ogni individuo. La distribuzione unitaria è riportata nella prima tabella mentre la seconda tabella riporta la distribuzione unitaria per una seconda popolazione che chiameremo popolazione B. Popolazione B Popolazione A Unità statistica # titoli azionari Unità statistica # titoli azionari Individuo 1 0 Individuo 5 8 Individuo 2 8 Individuo 6 9 Individuo 3 12 Individuo 7 11 20 Individuo 8 12 Individuo 4 Calcoliamo la media. Che cosa possiamo dire sulla variabilità delle due distribuzioni? Statistica economica a.a. 2013/2014 3 Variabilità di una distribuzione • La variabilità di una distribuzione esprime la tendenza delle unità di una popolazione statistica ad assumere diverse modalità del carattere. Statistica economica a.a. 2013/2014 4 Requisiti fondamentali degli indici di variabilità 1) Un indice di variabilità deve assumere il suo valore minimo se e solo se tutte le unità della distribuzione presentano uguale modalità del carattere. 2) Un indice di variabilità deve aumentare all’aumentare della “diversità” tra le modalità assunte dalle varie unità. N.B. Poiché stiamo considerando caratteri quantitativi, la diversità tra le modalità viene misurata considerando o il valore assoluto o il quadrato della differenza tra le modalità o tra la singola modalità e la media. In questo modo, ogni “diversità” incrementa il valore dell’indice. 5 Statistica economica a.a. 2013/2014 Indici basati sullo scostamento dalla media aritmetica • Un indice basato sugli scostamenti dalla media aritmetica è la varianza. • La varianza di n valori x1 , x2 ,..., xn di una variabile X con media aritmetica x è σ2 = n 1 (xi − x )2 ∑ n i =1 n • Il numeratore è chiamato devianza: ∑ ( xi Formula 1 per distribuzione unitaria − x )2 i =1 Statistica economica a.a. 2013/2014 6 Formula della varianza per distribuzioni di frequenze relative o percentuali • Data la distribuzione di frequenze di una variabile X con K modalità, la varianza è data da: K 2 2 1K σ = ∑nj ( xj − x ) = ∑ f j ( xj − x ) n j=1 j=1 2 Formula 2 per distribuzione di frequenze relative K 2 2 1K 1 K σ = ∑n j x j − x = ∑ f j x j − x = ∑ p j x j − x 100 j =1 n j =1 j =1 ( 2 ) ( ) ( ) 2 Formula 3 per distribuzione di frequenze percentuali Statistica economica a.a. 2013/2014 7 Calcolo della varianza secondo la formula 1 Popolazione A Unità statistica # titoli azionari Individuo 1 0 Individuo 2 8 Individuo 3 12 Individuo 4 20 1 xa = n σ2 = 4 ∑ i =1 xi = Distribuzione unitaria 0 + 8 + 12 + 20 = 10 4 1n 1 1 2 2 2 2 2 ( xi − x) = ( 0−10) +(8−10) +(12−10) +( 20−10) = ⋅ 208 = 52 ∑ n i=1 4 4 Statistica economica a.a. 2013/2014 8 Calcolo della varianza secondo la formula 1 Unità statistica Tasso di crescita (ahimé negativo) del PIL, anno 2012 Tasso (%) Grecia -6,7 Italia -2,6 Portogallo -1,5 Spagna -1,8 xa = σ2 = 1 n 2 ∑( xi − x ) = n i =1 1 n 4 ∑x i =1 i = − 6, 7 − 2, 6 − 1, 5 − 1, 8 = − 3,1 5 4 1 2 2 2 2 = ( −6,7 − (−3,15) ) + ( −2,6 − (−3,15) ) + ( −1,5 − (−3,15) ) + ( −1,8 − (−3,15) ) = 4 1 = ⋅17,44 = 4,36 4 Statistica economica a.a. 2013/2014 9 Calcolo della varianza per la distribuzione del numero di agenti inquinanti nell’atmosfera Statistica economica a.a. 2013/2014 10 • La varianza si può anche calcolare usando questa formula: σ2 = 1 n 2 xi − (x )2 ∑ n i =1 Formula 1/bis per distribuzione unitaria • La varianza corrisponde quindi alla differenza tra il momento secondo e il momento primo al quadrato. 11 Statistica economica a.a. 2013/2014 • Data σ2 = la distribuzione di frequenze di una variabile X con K modalità, la formula della varianza diventa: K 1 K 2 2 n x − . x = f j x2j − x 2 ∑ ∑ j j n j =1 j =1 Formula 2/bis per distribuzione di frequenze relative K 1 K 1 K 2 2 2 2 σ = ∑ n j x j − .x = ∑ f j x j − x = p j x 2j − .x 2 ∑ n j =1 100 j =1 j =1 2 Statistica economica a.a. 2013/2014 Formula 3/bis per distribuzione di frequenze percentuali 12 Calcolo della varianza per la distribuzione del numero di agenti inquinanti nell’atmosfera usando la formula 2/bis X 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 xj ² fj xj²*fj 1 4 9 16 25 36 49 64 81 100 121 144 169 196 225 0,0097 0,0097 0,0388 0,0583 0,0874 0,1165 0,1165 0,1456 0,2233 0,0583 0,0583 0,0388 0,0291 0,0000 0,0097 0,0097 0,0388 0,3492 0,9328 2,1850 4,1940 5,7085 9,3184 18,0873 5,8300 7,0543 5,5872 4,9179 0,0000 2,1825 66,40 Corrisponde al quadrato della media aritmetica. La media aritmetica si chiama anche momento primo, che viene elevato al quadrato nella formula alternativa di calcolo della varianza - 59,57 = 6,82 13 Statistica economica a.a. 2013/2014 Calcolo della varianza per la distribuzione del numero di abitanti in 103 città italiane. Le modalità sono state suddivise in classi cj pj 25 xa = 1 1 00 4 ∑c j ⋅ p j = 24 4,17 4 j =1 18,45 75 39,41 σ2 = 1 4 ∑ p j x2j − x 2 = 100 j =1 1 2 2 2 2 18, 45 ⋅ ( 25 ) + 39, 41 ⋅ ( 75 ) + 35,92 ( 300 ) + 5,83 ⋅ (1750 ) − (244,174) 2 = 100 = 153582,93 = σ 2 = 300 35,92 1750 5,83 1 100 4 ∑ 2 p j (xj − x ) = j =1 1 2 2 2 2 18, 45 ⋅ ( 25 − 244,174 ) + 39, 41 ⋅ ( 75 − 244,174 ) + 35, 92 ( 300 − 244,174 ) + 5, 83 ⋅ (1750 − 244,174 ) = 100 = 153457, 36 = Statistica economica a.a. 2013/2014 14 La varianza di un carattere Y ottenuto dalla trasformazione Y di un carattere X con media x e varianza σ2 = αX + β è: Var (Y ) = α 2σ 2 15 Statistica economica a.a. 2013/2014 • La varianza non possiede la stessa unità di misura dei valori della distribuzione. • La deviazione standard (o scarto quadratico medio) ha la stessa unità di misura della variabile considerata. σ = σ2 • Come per la varianza, maggiore è la variabilità delle modalità del carattere assunte dalle unità statistiche, maggiore è la deviazione standard. • Se le unità statistiche possiedono tutte la stessa modalità, la deviazione standard e la varianza avranno valore nullo. Statistica economica a.a. 2013/2014 16 Calcolo della varianza e dello scarto quadratico medio per la distribuzione del numero di abitanti in 103 città italiane. Le modalità sono state suddivise in classi cj pj 25 xa = 1 1 00 4 ∑c j ⋅ p j = 24 4,17 4 j =1 18,45 75 39,41 σ2 = 1 4 ∑ p j x2j − x 2 = 100 j =1 1 2 2 2 2 18, 45 ⋅ ( 25 ) + 39, 41 ⋅ ( 75 ) + 35,92 ( 300 ) + 5,83 ⋅ (1750 ) − (244,174) 2 = 100 = 153582,93 = σ 2 = 300 35,92 1750 5,83 1 100 4 ∑ σ = σ 2 = 391, 89 2 p j (xj − x ) = j =1 1 2 2 2 2 18, 45 ⋅ ( 25 − 244,174 ) + 39, 41 ⋅ ( 75 − 244,174 ) + 35, 92 ( 300 − 244,174 ) + 5, 83 ⋅ (1750 − 244,174 ) = 100 = 153457, 36 = σ = σ 2 = 391, 74 Statistica economica a.a. 2013/2014 17 Indici di variabilità assoluti Deviazione standard e varianza sono indici di variabilità assoluti con la stessa unità di misura (elevata al quadrato per la varianza) del carattere statistico. Non è quindi possibile eseguire confronti tra la variabilità di caratteri che hanno unità di misure diverse come, per esempio, centimetri e grammi. Non è nemmeno corretto eseguire confronti tra la variabilità di due caratteri con la stessa unità di misura (per esempio i kg) ma osservati in due collettivi caratterizzati da ordini di grandezza diversi (per esempio bambini e adulti). Statistica economica a.a. 2013/2014 18 Coefficiente di variazione (CV) Per confrontare la variabilità di due distribuzioni per il carattere X con x > 0 può essere utilizzato il coefficiente di variazione: CV = σ x 100 • Se la media aritmetica è minore di zero, deve essere considerata in valore assoluto. Statistica economica a.a. 2013/2014 19 Il Coefficiente di variazione (CV) è una misura della variabilità media di una distribuzione intorno al suo valore medio. Si esprime in termini percentuali in modo da poter confrontare la variabilità di più distribuzioni riferite a caratteri statistici espressi in unità di misura diverse. Tuttavia, il Coefficiente di variazione si utilizza anche per confrontare la variabilità di uno stesso carattere (quindi stessa unità di misura), osservato su popolazioni statistiche diverse. Statistica economica a.a. 2013/2014 20 Calcolo del coefficiente di variazione (CV) Statistica economica a.a. 2013/2014 21 Calcolo del coefficiente di variazione (CV) Statistica economica a.a. 2013/2014 22 Teorema di Chebyshev Data una distribuzione di valori xi dei quali si conoscono solo la media x e la deviazione standard σ e dato un valore reale positivo k, f ( xi − x ≥ k σ ) ≤ 1 k2 Statistica economica a.a. 2013/2014 23 Applicazione del teorema di Chebyshev Popolazione con statura media 170 cm e deviazione standard uguale a 20 cm. Qual è la frequenza relativa delle persone con statura superiore o inferiore a 2 volteσ ? x − 2σ x x + 2σ 130 170 210 • La frequenza relativa non è superiore a 0,25 (25% in termini percentuali). Statistica economica a.a. 2013/2014 24 Considerazioni sul teorema di Chebyshev La rilevanza del teorema di Chebyshev viene meno quando è nota la distribuzione del carattere. In questo caso, infatti, possiamo determinare con esattezza la frequenza relativa delle unità statistiche esterne (o interne) ad un determinato intervallo. • xj 1 3 8 9 15 nj 2 4 9 11 4 Per il teorema di Chebyshev non più del 44,4% delle unità cade all’esterno dell’intervallo [2,68; 13,66]. In realtà è il 20% delle osservazioni a cadere all’esterno. Statistica economica a.a. 2013/2014 25 Il Teorema di Chebyshev è molto utile quando la distribuzione del carattere X non è nota. Ma quando quest’ultima è conosciuta, allora è meglio usarla direttamente senza ricorrere al teorema per determinare il valore esatto della frequenza con cui le modalità cadono al di fuori di un dato intervallo simmetrico intorno alla media aritmetica. Statistica economica a.a. 2013/2014 26 Teorema di Markov Data una variabile X che assume solo valori non negativi dei quali è nota la media aritmetica , per un qualsiasi valore a>0 vale f ( X ≥ a) ≤ x a Statistica economica a.a. 2013/2014 27 Applicazione del Teorema di Markov Collettivo statistico: 200 bambini di età compresa tra 0 e 8 anni. Carattere studiato: altezza misurata in cm. Media aritmetica: 75,4 cm. Qual è al massimo la frequenza dei bambini che hanno un’altezza maggiore o uguale ai 140 cm? f ( X ≥ 140 ) ≤ 75, 4 = 0, 5385 140 Non più del 53,85% dei bambini osservati è alto 140 cm o di più. Statistica economica a.a. 2013/2014 28 La standardizzazione La standardizzazione è una particolare trasformazione lineare che applicata ai dati originali riconduce qualsiasi variabile X con media x e deviazione standard σx a una nuova variabile con media nulla e varianza unitaria. Ogni osservazione viene trasformata in un nuovo valore: Attenzione, nel manuale viene usata la lettera y al posto di z. zi = xi − x σ La distribuzione risultante ha media nulla e varianza unitaria. 29 Statistica economica a.a. 2013/2014 L’utilità della standardizzazione: un esempio Due studenti della Scuola di Giurisprudenza della Bicocca, Marco e Piero, sostengono, rispettivamente, l’esame di Diritto costituzionale e di Diritto privato con i seguenti risultati: Voto Media dei voti conseguiti nello stesso appello Scarto quadratico medio Scarto quadratico medio Marco 28 26 2,1 0,95 Piero 26 21 2,6 1,92 Marco ha indubbiamente conseguito un voto più alto. Tuttavia tenendo conto dell’andamento generale dei due diversi appelli, Piero ha ottenuto un risultato migliore rispetto a Marco. Statistica economica a.a. 2013/2014 30 Statistica economica a.a. 2013/2014 31 Statistica economica a.a. 2013/2014 32 Statistica economica a.a. 2013/2014 33 Statistica economica a.a. 2013/2014 34 Intervalli di variazione (1) • Noi studieremo due particolari intervalli di variazione: 1) il range o campo di variazione e 2) il range interquartile o differenza interquartile • Campo di variazione Dati n valori ordinati in senso crescente, x1 ≤ x2 ≤≤ xn , il campo di variazione è dato dalla differenza tra il valore più grande e il valore più piccolo della distribuzione, R = xn − x1 • Quando il carattere è suddiviso in classi, il campo di variazione viene calcolato come differenza tra l’estremo superiore dell’ultima classe e l’estremo inferiore della prima classe. 35 Statistica economica a.a. 2013/2014 Intervalli di variazione (2) • Differenza interquartile Dati n valori ordinati in senso crescente, x1 ≤ x2 ≤≤ xn , la differenza interquartile è data dalla differenza tra il terzo e il primo quartile, W = Q3 − Q1 • Ricordando la definizione data dei quartili, possiamo dire che la differenza interquartile rappresenta il campo di variazione per il 50% delle unità centrali ovvero delle unità più vicine alla mediana. • La differenza interquartile non è influenzata dalla presenza di valori anomali. Statistica economica a.a. 2013/2014 36 Asimmetria • Una distribuzione è asimmetrica se non è possibile individuare un asse verticale che suddivide la distribuzione in due parti specularmente uguali. Una distribuzione di frequenze è simmetrica se: n1 = nk , n2 = nk −1, n j = nk − j +1 Statistica economica a.a. 2013/2014 37 Box-plot o Scatola a baffi Il box-plot è un grafico caratterizzato da tre elementi: 1) una linea o punto, che indicano la posizione della mediana della distribuzione; 2) un rettangolo (box) la cui altezza indica la variabilità dei valori “prossimi” alla mediana; 3) due segmenti che partono dal rettangolo e i cui estremi sono determinati in base ai valori estremi della distribuzione. In genere, come altezza del box, si considera la distanza interquartile e come estremi dei due baffi il valore minimo e massimo osservati. Inoltre, abbiamo sempre evidenziato la media aritmetica attraverso una crocetta. Statistica economica a.a. 2013/2014 38 Box-plot: esempio N° atti aggressivi 1 2 3 4 5 6 7 8 9 10 frequenza 3 8 30 45 22 12 10 5 2 1 12 10 8 6 4 Max = 10 Min = 1 2 Q3=5 Q1=3 0 Valore mediano: Me=4 Statistica economica a.a. 2013/2014 39 Ancora sull’asimmetria Distribuzione con coda a destra o con asimmetria positiva. La media aritmetica sarà superiore alla mediana. 12 10 8 6 4 Max = 10 Min = 1 2 Q3=5 Q1=3 0 Valore mediano: Me=4 Statistica economica a.a. 2013/2014 40 Carattere equidistribuito Un carattere quantitativo trasferibile X , con n valori osservati, x1 , x2 , , xn , è equidistribuito se ognuna delle n unità possiede 1/n dell’ammontare complessivo del carattere, ovvero 1 n xi = ∑xi = x. n i=1 La somma di tutti gli n valori viene indicata con A dal manuale Se il carattere non è equidistribuito, vi sarà un certo grado di concentrazione del carattere che può essere misurato tramite opportuni indici. Statistica economica a.a. 2013/2014 41 Massima concentrazione Si ha massima concentrazione quando l’intero ammontare del carattere è posseduto da una sola unità della polazione statistica, quindi: x1 = x2 = ... = xn−1 = 0 e xn = A. N.B. Non sempre sono realmente possibili i casi di equidistribuzione e di massima concentrazione (esempio del numero di addetti per impresa). Statistica economica a.a. 2013/2014 42 Esempio: il caso del numero di addetti in 20 imprese Popolazione statistica: 20 imprese Carattere statistico: numero di addetti per impresa Media aritmetica del carattere statistico: 6,5 addetti E’ possibile una situazione di equidistribuzione? NO ma possiamo immaginare una situazione prossima all’equidistribuzione come, per esempio, 19 imprese che hanno 6 addetti e la ventesima impresa che ne ha 16. N.B. Il numero totale di addetti è 130 = 6,5·20 E’ possibile una situazione di massima concentrazione? Statisticamente si: 19 imprese non hanno addetti e la 20esima ne ha 130, ma nella realtà le imprese hanno bisogno di almeno un addetto per svolgere la propria attività. “Stabilito che in molti casi reali le situazioni di equidistribuzione e di massima concentrazione non si possono verificare, considereremo queste come due situazioni ideali di riferimento dalla quali la situazione osservata si può più o meno discostare” (Borra, Di Ciaccio, p. 89). 43 Statistica economica a.a. 2013/2014 Relazione concentrazione/variabilità Tanto più un carattere è concentrato, tanto più elevata è la variabilità del carattere. Se il carattere non è variabile tra le unità statistiche allora la concentrazione è nulla. Statistica economica a.a. 2013/2014 44 Misure di concentrazione: indice C Consideriamo una carattere quantitativo trasferibile X le cui modalità sono ordinate in senso non decrescente. Indice C n−1 C = ∑(Fi − Qi ), i=1 dove 45 Statistica economica a.a. 2013/2014 Esempio delle 9 emittenti radiofoniche per misurare l’indice di concentrazione Popolazione statistica: 9 emittenti radiofoniche, i = 1, …., n Carattere statistico: introiti pubblicitari (in milioni di euro) i/n 339 A1 x = = 1 11879 A A A2 x + x2 339 + 461 0, 07 = = = 1 11879 A A A3 x + x2 + x3 339 + 461 + 697 0 ,1 3 = = = 1 11879 A A 0, 03 = 4 A4 339 + 461 + 697 + 1320 = = 0, 24 = A 11879 . ∑ xi i=1 A . . 8 A8 3 3 9 + 4 6 1 + ... + 1 8 5 7 + 1 8 8 9 0,83 = = = A 11879 1 = A9 11879 = = 11879 A ∑ A xi i=1 A xi i =1 9 A Statistica economica a.a. 2013/2014 ∑ 46 Calcolo dell’indice C n −1 C = ∑ ( Fi − Qi ) = (0,11 − 0,03) + (0, 22 − 0,07) + (0,33 − 0,13) + i =1 +(0, 44 − 0, 24) + (0,56 − 0,37) + (0,67 − 0,52) + (0,78 − 0,67) + +(0,89 − 0,83) = 1,18 47 Statistica economica a.a. 2013/2014 •Supponiamo ora che gli introiti pubblicitari siano equidistribuiti tra le 9 emittenti radiofoniche A = 11879 milioni di euro 11879 xi = = 1319,88 milioni di euro 9 • L’indice C è uguale a zero perché la concentrazione è nulla. Statistica economica a.a. 2013/2014 48 •Supponiamo infine che 1 sola emittente concentri l’intero ammontare degli introiti pubblicitari n −1 C = ∑F i = 0,1 1 + 0, 2 2 + 0, 3 3 + i =1 + 0, 4 4 + 0, 5 6 + 0, 6 7 + 0, 7 8 + + 0, 8 9 = 4 49 Statistica economica a.a. 2013/2014 Misure di concentrazione: rapporto di concentrazione di Gini Consideriamo una carattere quantitativo trasferibile X le cui modalità sono ordinate in senso non decrescente. Rapporto di concentrazione di Gini n−1 1 R = n−1 ∑F ∑(F − Q ). i i i =1 i i =1 Statistica economica a.a. 2013/2014 50 Tornando all’esempio delle emittenti radiofoniche Rapporto di concentrazione di Gini R= n −1 1 n −1 ∑F ∑ (F − Q ) = i i i =1 1,18 = 0, 295 4 i i =1 51 Statistica economica a.a. 2013/2014 Curva di Lorenz Mediante le coppie Qi , Fi è possibile realizzare un grafico chiamato curva di Lorenz Statistica economica a.a. 2013/2014 52 Omogeneità ed eterogeneità Si ha massima omogeneità quando tutte le unità della popolazione statistica presentano la stessa modalità, per esempio, la j-esima. f1 = f2 =... = f j−1 = f j+1 =... = fk = 0 e f j =1 Si ha massima eterogeneità (o minima omogeneità) quando tutte le modalità sono presenti con la stessa frequenza nella popolazione statistica. f1 = f2 =... = f j =... = fk = 1 k Statistica economica a.a. 2013/2014 53 Omogeneità ed Eterogeneità: casi intermedi • Un carattere tende a essere distribuito in maniera omogenea se le unità statistiche assumono un numero molto limitato di modalità. • Un carattere tende a essere tanto più eterogeneo quanto più le osservazioni tendono ad assumere diverse modalità con frequenza quasi uguale. Statistica economica a.a. 2013/2014 54 Indice di omogeneità k O1 = ∑ j =1 1 k 2 f = 2 ∑ nj n j =1 2 j O1 = 1 massima omogeneità O1 = 1 minima omogeneità k 1 1 1 1 1 1 + + ... + + ... + = k ⋅ = k12 k22 k 2j kk2 k2 k N.B. k1 = k2 = ... = k j = ... = kk = k 55 Statistica economica a.a. 2013/2014 Indice di eterogeneità di Gini k E1 = 1 − O1 = 1 − ∑ f j2 = 1 − j =1 1 k 2 ∑ nj n 2 j =1 E1 = 1 − 1 = 0 minima eterogeneità E1 = 1 − e1 = 1 k −1 = massima eterogeneità k k E1 k −1 k Statistica economica a.a. 2013/2014 56 Applicazione dell’indice di omogeneità Composizione della Camera: distinzione dei deputati per titolo di studio Titolo di studio (carattere statistico) nj Licenza media 11 Diploma di istruzione secondaria superiore 186 Laurea breve o diploma universitario 6 Laurea 427 O1 = anno 2008; Fonte: Competenze parlamentari 4 1 1 − ∑ n 2j = ⋅ (112 + 186 2 + 6 2 + 427 2 ) = 0, 55 2 n (630) 2 j =1 O1 0,25 0,55 1 minima omogeneità max omogeneità 57 Statistica economica a.a. 2013/2014 Applicazione degli indici di eterogeneità • Rivalutiamo ora la distribuzione precedente sul titolo dei deputati alla Camera in termini di eterogeneità. E1 = 1 − O1 = 1 − 0, 55 = 0, 45 e1 = 0, 45 = 0, 6 0, 75 Il grado di eterogeneità della distribuzione corrisponde al 60% del livello di eterogeneità massima E1 0 minima eterogeneità Statistica economica a.a. 2013/2014 0,45 0,75 max eterogeneità 58 Esercizio di riepilogo Domanda 2 della prova d’esame del 18-6-2013 • La tabella seguente considera una popolazione statistica di 120 occupati secondo il settore di attività: Settore Industria Commercio Altro nj 20 40 60 a) Calcolate l’indice di eterogeneità E1 b) Riproducete una seconda tabella in cui rappresentate il caso di massima eterogeneità. Come andrebbero disposte le frequenze? c) Riproducete una terza tabella in cui rappresentate un caso di massima omogeneità. Statistica economica a.a. 2013/2014 59 Case study di riepilogo: distribuzione dei redditi in Italia • Indice di concentrazione di Gini calcolato sui redditi familiari (dati Banca d’Italia, Indagine sui redditi delle famiglie italiane): •anno 1991: 28,2%; • anno 2004: 33,7 • anno 2010: 35,1 • nel 2009: 29,1 in Germania e 24,1 in Svezia (dati Eurostat). • “La ricchezza netta presenta una concentrazione maggiore di quella del reddito: il 10% delle famiglie più ricche possiede il 45,9% dell’intera ricchezza netta delle famiglie italiane (contro il 44,3% registrato nel 2008). L’indice di Gini è pari al 62,4% nel 2010”. Da Banca d’Italia (2012), I bilanci delle famiglie italiane nell’anno 2010, Supplementi al Bollettino Statistico, n.6 Statistica economica a.a. 2013/2014 60 Case study (continua) Famiglie Reddito medio annuo Quota %le di reddito Primo 10% 7.933 2,4 Dal 10 al 20% 13.738 4,2 Dal 20 al 30% 17.433 5,3 Dal 30 al 40% 21.100 6,4 Dal 40 al 50% 24.972 7,7 Dal 50 al 60% 29.500 9 Dal 60 al 70% 34.573 10,6 Dal 70 all’80% 41.252 12,6 Dall’80 al 90% 51.238 15,7 Dal 90 al 100% 85.511 26,1 Il primo 10% delle famiglie, ordinate in base al reddito, ha il 2,4% dei redditi La quota di reddito delle famiglie appartenenti al 10° decile corrisponde circa alla somma dei primi 5 decili 100 61 Riferimenti bibliografici e Homework • • • • • • Capitolo 4 del Borra, Di Ciaccio. Gli Scostamenti semplici medi (pp. 80 e 81) non sono in programma. La definizione formale di valore anomali e valori eccedenti non è in programma. La terza formula per calcolare il Rapporto di concentrazione di Gini alla fine di pagina 90 non è in programma. Anche gli argomenti trattati a pag. 91 non rientrano nel programma di esame. Gli indici di omogeneità ed eterogeneità che rientrano nel programma di esame sono O1, E1 ed e1. Svolgere esercizi 4.2, 4.6 (gli scostamenti semplici medi dalla media aritmetica e dalla mediana nono sono da calcolare perché non sono in programma), 4.10, 4.13 a pagina 101, 102 e 103 del Borra Di Ciaccio. Statistica economica a.a. 2013/2014 62