Corso di Laurea: Economia Aziendale Insegnamento: Statistica Docente: G.Latorre, D.Costanzo, M.Misuraca Docente: G.Latorre, D.Costanzo, M.Misuraca Lezione n° 08 1 – La concentrazione Nello studio dei fenomeni economici e sociali descritti attraverso caratteri quantitativi di tipo trasferibile può essere interessante analizzare la cosiddetta concentrazione E’ trasferibile quel carattere la cui intensità globale o una sua parte è attribuibile (anche solo idealmente) ad una o ad un certo numero di unità del collettivo oggetto di studio: Caratteri trasferibili Caratteri non trasferibili Reddito R ddit Quote di mercato Quote di produzione Rischio commerciale (fatturato) ( ) … Età Altezza Peso Componenti del nucleo familiare p … Se i valori della variabile sono livelli raggiungibili da qualsiasi unità ed ha un senso la loro Se i valori della variabile sono livelli raggiungibili da qualsiasi unità ed ha un senso la loro somma o aggregazione allora lo studio di concentrazione è plausibile Corso di Laurea: Economia Aziendale Insegnamento: Statistica Docente: G.Latorre, D.Costanzo, M.Misuraca Docente: G.Latorre, D.Costanzo, M.Misuraca Lezione n° 08 2 – Trasferibilità dei caratteri Data una distribuzione unitaria di n osservazioni di un carattere X ordinati in senso crescente Data una distribuzione unitaria di n osservazioni di un carattere X, ordinati in senso crescente x1 ≤ x 2 ≤ ... ≤ xn si è interessati a studiare come l’ammontare totale del carattere n A=∑ x i i=1 sia ripartito fra le diverse unità statistiche che compongono il collettivo: (1) equidistribuzione ciascuna delle n unità possiede 1/n dell’ammontare complessivo A del carattere, ossia: x i = A n =x (2) massima concentrazione ll’intero intero ammontare del carattere è posseduto da una unità: ammontare del carattere è posseduto da una unità: x 1 = x 2 =...=x n‐1 =0 x n =A=n x Corso di Laurea: Economia Aziendale Insegnamento: Statistica Docente: G.Latorre, D.Costanzo, M.Misuraca Docente: G.Latorre, D.Costanzo, M.Misuraca Lezione n° 08 3 – Definizioni preliminari Si consideri un carattere (trasferibile) X osservato su un collettivo di N unità statistiche e Si consideri un carattere (trasferibile) X osservato su un collettivo di N unità statistiche e siano queste ordinate secondo l’ammontare posseduto Indichiamo con pi la frequenza relativa cumulata delle prime i Indichiamo con p la frequenza relativa cumulata delle prime i unità i pi = n Allo stesso modo, dato l’ammontare A, indichiamo con qi la frazione cumulata del carattere posseduto dalle prime i unità Ai qi = con Ai =A1 +A2 +A3 +...+Ai A Si dimostra che per ogni unità del collettivo vale la relazione pi ≥ qi Corso di Laurea: Economia Aziendale Insegnamento: Statistica Docente: G.Latorre, D.Costanzo, M.Misuraca Docente: G.Latorre, D.Costanzo, M.Misuraca Lezione n° 08 4 – Misurare la concentrazione Per misurare la concentrazione di un carattere X in un collettivo è necessario considerare gli Per misurare la concentrazione di un carattere X in un collettivo è necessario considerare gli scarti (differenze) tra frequenze relative cumulate delle unità statistiche e frazione cumulata dell’ammontare di carattere posseduto: c i =(p i ‐qi ) La concentrazione totale nel collettivo è ottenuta sommando gli scarti N‐1 ( ‐q ) ∑ (p i i i=1 (1) quando si ha minima concentrazione (EQUIDISTRIBUZIONE) la somma è pari a 0 N‐1 ( ) quando si ha massima concentrazione allora la somma è pari a (2) d h ll l è ∑p i=1 i Corso di Laurea: Economia Aziendale Insegnamento: Statistica Docente: G.Latorre, D.Costanzo, M.Misuraca Docente: G.Latorre, D.Costanzo, M.Misuraca 5 – Costruire un indice normalizzato Lezione n° 08 IIn statistica spesso abbiamo l’esigenza di costruire indici che consentano un confronto tra le t ti ti bbi l’ i di t i i di i h t f t t l modalità di una distribuzione o tra distribuzioni diverse prescindendo dall’unità di misura del carattere studiato Per ottenere un indice che varia tra 0 e 1 e può essere espresso in percentuale si usa dividere il valore dell’indice per il valore massimo che l’indice stesso può assumere: ESEMPIO ni = numero di unità statistiche che presentano la i‐esima modalità fi = numero di unità statistiche che presentano la i‐esima modalità in rapporto alla dimensione del collettivo In generale l’indice ottenuto come rapporto tra il valore osservato e il massimo valore che si poteva osservare rispetto al fenomeno studiato è detto INDICE NORMALIZZATO N.B.: la misura è influenzata dalle ipotesi iniziali assunte per calcolare il massimo dell’indice Corso di Laurea: Economia Aziendale Insegnamento: Statistica Docente: G.Latorre, D.Costanzo, M.Misuraca Docente: G.Latorre, D.Costanzo, M.Misuraca Lezione n° 08 6 – L’indice di Gini Per misurare la concentrazione di un carattere in un collettivo è possibile utilizzare un indice P i l t i di tt i ll tti è ibil tili i di normalizzato noto come rapporto di concentrazione di Gini n‐1 n‐1 ∑ (p ‐q ) i R R= i=1 i=1 i =1‐ 1 n‐1 ∑p ∑q i i i=1 n‐1 ∑p i i=1 se R=0 se R=0 equidistribuzione se R=1 max concentrazione Si esprime in percentuale: un valore k compreso tra 0 e 1 indica un livello di concentrazione pari al k% di quella massima osservabile nella distribuzione del carattere studiato Corso di Laurea: Economia Aziendale Insegnamento: Statistica Docente: G.Latorre, D.Costanzo, M.Misuraca Docente: G.Latorre, D.Costanzo, M.Misuraca 7 – Regole di lettura dell’indice Lezione n° 08 La lettura e l La lettura e l’interpretazione interpretazione di un indice è semplice ma spesso risulta difficile esprimerlo in modo di un indice è semplice ma spesso risulta difficile esprimerlo in modo chiaro e univocamente comprensibile In generale abbiamo visto come per R=0 si possa dire che “non c’è concentrazione” oppure che “ ’è “c’è equidistribuzione” idi t ib i ” del carattere studiato nel collettivo; allo stesso modo per R=1 si può dire d l tt t di t l ll tti ll t d R 1 i ò di che “c’è massima concentrazione” Quando l’indice R è compreso tra 0 e 1 allora la quantità ottenuta può essere letta in termini percentuali rispetto a quella massima osservabile in quel collettivo per quel carattere: ‐ da 0 a 0,25 la concentrazione è bassa (es. R=0,18 ‐> 18% della max concentrazione osservabile, quindi si ha una bassa concentrazione) ‐ da 0,25 a 0,5 la concentrazione è medio‐bassa (es. R=0,36 ‐> 36% della max concentrazione osservabile, quindi si ha una concentrazione medio‐bassa) ‐ per R=0,5 si ha una media concentrazione per R 0 5 si ha una media concentra ione ‐ da 0,5 a 0,75 la concentrazione è medio‐alta (es. R=0,69 ‐> 69% della max concentrazione osservabile, quindi si ha una concentrazione medio‐alta) ‐ da 0,75 a 1 la concentrazione è alta (es. R=0,83 ‐> 83% della max concentrazione osservabile, quindi si ha una alta concentrazione) Corso di Laurea: Economia Aziendale Insegnamento: Statistica Docente: G.Latorre, D.Costanzo, M.Misuraca Docente: G.Latorre, D.Costanzo, M.Misuraca Lezione n° 08 8 – Uno schema per il calcolo unità X pi Ai qi pi ‐ qi 1 x1 1/n A1 A1/An p1 – q1 2 x2 2/n A2 A2/An p2 – q2 3 x3 3/n A3 A3/An p3 – q3 … … … … … … i xi i/n Ai Ai/An pi ‐ qi … … … … … … n xn 1 An 1 0 Ordinate i in senso crescente Per procedere da un punto di d d di vista operativo allo studio della concentrazione è conveniente organizzare i dati secondo la tabella riportata di fianco n ‐1 ∑ (p ‐q ) i R= i Totale dell’ultima colonna fino alla penultima riga i= 1 n ‐1 ∑p i= 1 i Totale della terza colonna fino alla penultima riga Corso di Laurea: Economia Aziendale Insegnamento: Statistica Docente: G.Latorre, D.Costanzo, M.Misuraca Docente: G.Latorre, D.Costanzo, M.Misuraca Lezione n° 08 9 – Esempio Emittenti televisive Vogliamo studiare la concentrazione dei ricavi derivanti dalla pubblicità di un collettivo di emittenti private operanti in una operanti in una certa Regione Introiti pubblicitari Tele Noi TV9 Rete Beta Telesuper Canale 20 Noia TV Tele Bella Onda Sud TV Maxi 3390 4610 6970 13200 15240 17980 18570 18890 19940 TOTALE: 118790 i pi 1 2 3 4 5 6 7 8 9 0,111 0,222 0,333 0,444 0,556 0,667 0,778 0,889 1 Ai qi 3390 0,029 8000 0,067 14970 0,126 28170 0,237 43410 0,365 61390 0,517 79960 0,673 98850 0,832 118790 1 n‐1 n 1 ∑ (p ‐q ) i R= i=1 n‐1 n 1 ∑ pi i=1 i =0,288 → 29% La concentrazione degli introiti pubblicitari è pari al 29% di quella massima osservabile C’è un basso livello di concentrazione Corso di Laurea: Economia Aziendale Insegnamento: Statistica Docente: G.Latorre, D.Costanzo, M.Misuraca Docente: G.Latorre, D.Costanzo, M.Misuraca Lezione n° 08 10 – Alcune considerazioni (1) La tabella rappresentata in basso riporta i redditi di una società in cui vivono cinque individui. A causa della rapida crescita economica, i redditi di tutti gli individui raddoppiano. In questa società la disuguaglianza è aumentata, diminuita o invariata? u.s. xi Ai pi qi pi ‐ qi 1 200 200 2 450 650 3 550 1200 4 750 1950 5 1000 2950 0,2 0,4 0,6 0,8 1,0 0,068 0,220 0,407 0,661 1,000 0,132 0,180 0,193 0,139 0 u.s. R= 0,322 xi Ai pi 1 400 400 2 900 1300 3 1100 2400 4 1500 3900 5 2000 5900 0,2 0,4 0,6 0,8 1,0 qi pi ‐ qi 0,068 0,220 0,407 0,661 1,000 0,132 0,180 0,193 0,139 0 R= 0,322 Quindi se applichiamo una trasformazione del tipo aX al carattere studiato manteniamo lo stesso livello di concentrazione, come dimostrato dall’esempio Cosa accade se invece applichiamo una trasformazione del tipo X+b al carattere? Proviamo ad aggiungere a tutte le unità 500, 1000 e 2000€: cosa accade al livello di concentrazione del reddito? Corso di Laurea: Economia Aziendale Insegnamento: Statistica Docente: G.Latorre, D.Costanzo, M.Misuraca Docente: G.Latorre, D.Costanzo, M.Misuraca Lezione n° 08 11 – Alcune considerazioni (2) u.s. xi Ai 1 200 200 2 450 650 3 550 1200 4 750 1950 5 1000 2950 pi 0,20 0,40 0,60 0 80 0,80 1,00 qi 0,068 0,220 0,407 0 661 0,661 1,000 pi ‐ qi 0,132 0,180 0,193 0 139 0,139 0,000 +500 1 700 700 2 950 1650 3 1050 2700 4 1250 3950 5 1500 5450 0,20 0 40 0,40 0,60 0,80 1,00 0,128 0 303 0,303 0,495 0,725 1,000 0,072 0 097 0,097 0,105 0,075 0,000 R = 0,174 (17%) +1000 1 2 3 4 5 0,20 0,40 0,60 0,80 1,00 0,151 0,333 0,528 0,748 1,000 0,049 0,067 0,072 0,052 0,000 R = 0,119 (12%) +2000 1 2 3 4 5 1200 1450 1550 1750 2000 1200 2650 4200 5950 7950 2700 2700 2950 5650 3050 8700 3250 11950 3500 15450 0,20 0.40 0,60 0,80 1,00 0,175 0,366 0,563 0,773 1,000 0,025 0,034 0,037 0,027 0,000 R = 0,322 (32%) La concentrazione non è invariante per trasformazioni del tipo X+b Se il reddito di ciascun individuo aumenta in modo proporzionale la concentrazione non cambia, ma se il reddito cresce della stessa quantità allora la concentrazione risulterà à ll l l à inferiore, perché è come se il reddito di ogni unità “si avvicinasse” a quello degli altri… Infatti la frazione di reddito posseduta dalle diverse unità risulta essere: u.s. R = 0,061 (6%) 1 2 3 4 5 0,068 0,153 0,186 0,254 0,339 +500 +1000 +2000 0,128 0,174 0,193 0,229 0,275 0,151 0,182 0,195 0,220 0,252 0,175 0,191 0,197 0,210 0,227 Corso di Laurea: Economia Aziendale Insegnamento: Statistica Docente: G.Latorre, D.Costanzo, M.Misuraca Docente: G.Latorre, D.Costanzo, M.Misuraca 12 – Rappresentazione grafica della concentrazione Lezione n° 08 Con le coppie (p C l i ( i , qi) è possibile realizzare una rappresentazione grafica della concentrazione )è ibil li t i fi d ll t i detto Curva di Lorenz Frazione cumulata del carattere Frequenza cumulata delle unità Maggiore è l’area tra la bisettrice e la curva maggiore è il livello della concentrazione Corso di Laurea: Economia Aziendale Insegnamento: Statistica Docente: G.Latorre, D.Costanzo, M.Misuraca Docente: G.Latorre, D.Costanzo, M.Misuraca Lezione n° 08 13 – Esempio qi 1 Il valore di R esprime l’area compresa tra la spezzata di concentrazione e la tra la spezzata di concentrazione e la linea di equidistribuzione: più piccolo è R (fino a 0) più la spezzata si avvicina alla linea più grande è R (fino a 1) più alla linea, più grande è R (fino a 1) più la spezzata coincide con i cateti del triangolo (max concentrazione) 0.9 0.8 0.7 0.6 0.5 0.4 n‐1 0.3 ∑ (p ‐q ) i 0.2 R= 0.1 0 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 pi i i=1 =0 228 =0,228 n‐1 ∑p i i=1 Riprendendo l’esempio delle emittenti televisive si vede anche graficamente come ci sia una bassa concentrazione degli introiti pubblicitari Corso di Laurea: Economia Aziendale Insegnamento: Statistica Docente: G.Latorre, D.Costanzo, M.Misuraca Docente: G.Latorre, D.Costanzo, M.Misuraca 14 – Rapporto di Concentrazione e Curva di Lorenz Lezione n° 08 Consideriamo il livello di concentrazione di un fenomeno in due collettivi (il primo è indicato con la linea blu, il secondo con la linea tratteggiata rossa) qi qi A B pi pi Nel caso A possiamo dire che nel collettivo indicato con la linea blu il fenomeno è meno concentrato rispetto a quello indicato con la linea rossa Nel caso B non riusciamo invece dall Nel caso B non riusciamo invece dall’analisi analisi della Curva di Lorenz della Curva di Lorenz a dare una risposta precisa: a dare una risposta precisa: questo è uno dei limiti della rappresentazione grafica. Dobbiamo calcolare anche l’indice R per poter dire in quale collettivo il fenomeno è più o meno concentrato Corso di Laurea: Economia Aziendale Insegnamento: Statistica Docente: G.Latorre, D.Costanzo, M.Misuraca Docente: G.Latorre, D.Costanzo, M.Misuraca Lezione n° 08 15 – Concentrazione per distribuzioni di frequenza Consideriamo un carattere discreto con k modalità, e supponiamo di avere a disposizione il numero di unità statistiche sulle quali abbiamo osservato le diverse modalità In questo caso per calcolare la concentrazione è più comodo utilizzare le seguenti espressioni: h Frequenza cumulata delle unità nh ph = n ∑xn i i qh = i=1 k ∑xn i i i=1 P Per misurare la concentrazione utilizziamo ancora una volta l’indice di Gini i l i ili i l l’i di di Gi i Frazione cumulata del carattere Corso di Laurea: Economia Aziendale Insegnamento: Statistica Docente: G.Latorre, D.Costanzo, M.Misuraca Docente: G.Latorre, D.Costanzo, M.Misuraca 16 – Distribuzioni di frequenze in classi Lezione n° 08 Nelle distribuzioni di frequenza e nelle distribuzioni in classi abbiamo una informazione in più: possiamo rilevare quante unità statistiche posseggono un certo ammontare di carattere Nel caso di distribuzioni in classi per studiare la concentrazione dobbiamo considerare alcune ipotesi iniziali: CASO A: se conosciamo l’ammontare di carattere posseduto e il numero di unità si assume che CASO A: se conosciamo l’ammontare di carattere posseduto e il numero di unità si assume che ci sia equidistribuzione (ogni unità della classe possiede lo stesso ammontare di carattere) CASO B: se non conosciamo l’ammontare di carattere posseduto dalle unità della classe allora possiamo stimarlo moltiplicando il valore centrale per il numero di unità statistiche della classe In tale situazione possiamo utilizzare la formula k‐1 R ≅ 1‐∑( qi+1 + q qi )(pi+1 ‐ p pi ) ((k è il numero di classi)) i=0 Attenzione!!! In questo caso la sommatoria parte da i=0 Corso di Laurea: Economia Aziendale Insegnamento: Statistica Docente: G.Latorre, D.Costanzo, M.Misuraca Docente: G.Latorre, D.Costanzo, M.Misuraca Lezione n° 08 17 – Rappresentazione grafica qi B 1 0.9 L’area di max concentrazione (il triangolo OAB) è sempre pari a 1/2 0.8 0.7 L’area di concentrazione (indicata con R) si ottiene sottraendo alla max concentrazione i i trapezi e il triangolo (il primo da sinistra) i il i l (il i d i i ) tracciati sotto la spezzata 0.6 0.5 R 0.4 0.3 Per approssimazione otteniamo la formula già Per approssimazione otteniamo la formula già vista in precedenza 0.2 0.1 A 0 O 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 pi 1 ⎡ p 1 q1 q1 +q2 (p 2 ‐p 1 ) q +q (p ‐p ) ⎤ ‐⎢ + + + n‐1 n n n‐1 ⎥ +...+ n‐1 2 ⎣ 2 2 2 ⎦ ≅ 1‐ ∑ ( qi+1 + qi )(p i+1 ‐ p i ) R= 1 i=0 2 Corso di Laurea: Economia Aziendale Insegnamento: Statistica Docente: G.Latorre, D.Costanzo, M.Misuraca Docente: G.Latorre, D.Costanzo, M.Misuraca Lezione n° 08 18 – Esempio classi imprese p 0‐2 2043,0 3‐9 636,0 10‐19 103,2 20 49 20‐49 43 4 43,4 50‐99 11,8 100‐499 8,3 500‐999 0,8 , 2846,5 addetti 2718,3 2845,6 1352,0 1281 2 1281,2 808,7 1588,3 529,4 , 11123,5 Vogliamo studiare la concentrazione degli addetti nelle imprese di un certo settore: in questo caso si assume l’equidistribuzione dell’ammontare dell ammontare di carattere per ogni classe (addetti per impresa) di carattere per ogni classe (addetti per impresa) classi imprese pi 0‐2 2043,0 , 0,7177 , 0,7177 , 3‐9 636,0 0,2234 0,9412 10‐19 103,2 0,0363 0,9774 20‐49 43,4 0,0152 0,9927 50 99 50‐99 11 8 0,0041 11,8 0 0041 0,9968 0 9968 100‐499 8,3 0,0029 0,9997 500‐999 0,8 0,0003 1,0000 2846,5 1 Frequenza relativa delle imprese addetti 2718,3 , 2845,6 1352,0 1281,2 808 7 808,7 1588,3 529,4 11123,5 0,2444 , 0,2558 0,1215 0,1152 0 0727 0,0727 0,1428 0,0476 1 qi 0,2444 , 0,5002 0,6217 0,7369 0 8096 0,8096 0,9524 1,0000 ( qi+1 + qi )(pi+1 ‐ pi ) Frazione relativa degli addetti 0,1754 , 0,1664 0,0407 0,0207 0 0064 0,0064 0,0051 0,0005 0,4152 R ≅ 1 ‐ 0,4152= 0,5848 La concentrazione di addetti per impresa osservata, pari al 58% circa è medio‐alta circa, è medio alta Corso di Laurea: Economia Aziendale Insegnamento: Statistica Docente: G.Latorre, D.Costanzo, M.Misuraca Docente: G.Latorre, D.Costanzo, M.Misuraca 19 – Esercizi ((1)) Nella tabella di seguito sono riportati i redditi dichiarati (in €) per l’anno 2003 da alcuni parlamentari italiani g p ( )p p Studiare la concentrazione del reddito ((2)) Lezione n° 08 Nella tabella sono riportati i dati relativi agli spettatori dei primi 10 film della stagione 2003 p g p p g Studiare la concentrazione degli spettatori Corso di Laurea: Economia Aziendale Insegnamento: Statistica Docente: G.Latorre, D.Costanzo, M.Misuraca Docente: G.Latorre, D.Costanzo, M.Misuraca 20 – Esercizi Lezione n° 08 È stata analizzata la quantità di ferro (in mg) contenuta in 84 campioni di terreno A e 72 campioni di terreno B. I risultati sono riportati nella seguente tabella in cui sono riportate le distribuzioni di frequenza e seguente tabella in cui sono riportate le distribuzioni di frequenza e l’ammontare di ferro per ogni classe: TERRENO A TERRENO B quantità ferro (mg) n° campioni totale ferro (mg) n° campioni totale ferro (mg) 0 ‐| 5 15 20 8 40 5 ‐|| 15 5 15 18 108 8 112 15 ‐| 40 19 304 10 400 40 ‐| 60 12 600 25 1025 60 ‐| 70 6 390 15 975 70 ‐| 100 | 14 1260 6 426 Totale 84 2682 72 2978 Verificare in quale terreno il ferro è più concentrato