Corso di Statistica Concentrazione Prof.ssa T. Laureti a.a. 2013-2014 Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 1 Concentrazione Si studia la concentrazione come un aspetto della variabilità di un carattere quantitativo trasferibile (p.e. il reddito) Concentrazione C i nulla ll → l’ammontare l’ del d l carattere si distribuisce uniformemente tra le unità iàd dell collettivo ll i Concentrazione massima → ll’intero intero ammontare del carattere è posseduto da una sola unità Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 2 Intensità media e intensità complessiva x1 x2 x3 … xn osservazioni di un carattere X quantitativo trasferibile (p.e. reddito) ordinate x1 ≤ x2 ≤ x3 ≤ … ≤ xn n μ = media di X μ = x = (p.e. reddito medio) ∑x i =1 An = intensità complessiva di X (p.e. reddito totale) i n An = n ∑x i=1 i = nμ Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 3 Frequenze relative cumulate La concentrazione si misura a partire da due grandezze Fi : frequenze f eq en e relative elati e cumulate c m late Qi : intensità relative cumulate Per un insieme di n valori singoli Fi = cioè i n i = 1,2,...n F1 = 1 , n F2 = 2 , n ...., Fn = n =1 n Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 4 Intensità relative cumulate Definendo D fi d lle intensità i t ità assolute l t cumulate l t come A1=x1 A2=x1+x2 (il reddito delle prime due unità) ….. Ai=x1+x2+…+xi (il reddito delle prime i unità), la generica intensità relativa cumulata Qi è data da Q = A i , i = 1,2,..., n i cioè An Q1 = A1 A A , Q2 = 2 , ... , Qn = n = 1 An An An Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 5 Concentrazione dei ricavi dell’azienda per punto vendita Ricavi (valori ordinati) ) Freq. rel. cum. Fi Intens. ass. cum. Ai Intens. rel. cum. Qi X(1)=180 1/9=0,11 180 180/2925=0,06 X(2)=200 2/9=0,22 380 380/2925=0,13 X(3)=205 3/9=0,33 585 585/2925=0,20 X(4)=270 4/9=0,44 855 855/2925=0,29 X(5)=280 280 5/9 0 56 5/9=0,56 1135 1135/2925 0 39 1135/2925=0,39 X(6)=340 6/9=0,67 1475 1475/2925=0,50 X(7)=350 7/9=0 78 7/9=0,78 1825 1825/2925=0 62 1825/2925=0,62 X(8)=500 8/9=0,89 2325 2325/2925=0,79 600 X(9)=600 9/9=1 9/9 9 5 2925 9 5/ 9 5 2925/2925=1 ∑ = 2925 Ogni punto vendita pesa per 1/9 (11%) sul totale dei punti vendita Il primo terzo d i punti dei ti vendita dit (33%) realizza il 20% dei ricavi totali I primi due terzi dei punti vendita (67%) realizzano il 50% dei ricavi totali Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 6 Concentrazione Come misura del grado di concentrazione consideriamo una funzione delle differenze Fi − Qi per esempio la loro somma, ossia ∑ (Fi − Qi ) In particolare ⎧ ⎪ 0 n−1 ⎪ ( F − Q ) = ⎨ ∑ i i i=1 ⎪n−1 Fi ⎪⎩∑ i=1 equidistribuzione Ogni unità (che pesa per 1/n in termini di frequenze) detiene esattamente una frazione del carattere pari a 1/n. massima concentrazione Q1 = Q2 = ... = Qn−1 = 0 Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 7 Rapporto di concentrazione Un indice relativo di concentrazione è n-1 definito da: (F − Q ) R = ∑ i=1 i i n−1 ∑F i 1 i= 0≤R ≤1 i rapporto di concentrazione di Gini R=0 se c’è equidistribuzione R=1 R 1 se c c’è è massima concentrazione Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 8 Concentrazione dei ricavi dell’azienda per punto vendita Ricavi (valori ordinati) ) Freq. rel. cum. Fi Intens. rel. cum. Qi Fi - Qi X(1)=180 0,11 0,06 0,05 X(2)=200 0,22 0,13 0,09 X(3)=205 0,33 0,20 0,13 X(4)=270 0,44 0,29 0,15 X(5)=280 280 0 56 0,56 0 39 0,39 0 17 0,17 X(6)=340 0,67 0,50 0,17 X(7)=350 0 78 0,78 0 62 0,62 0 16 0,16 X(8)=500 0,89 0,79 0,10 600 X(9)=600 1 1 0 n−1 ∑ (F − Q ) = 1,02 i=1 i n −1 ∑F i 1 i= i i = 4 ,00 1,02 R= = 0,255 4,00 Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 9 Concentrazione dei ricavi dell’azienda per punto vendita Il grado di concentrazione osservato non è particolarmente alto. p Un elevato grado di concentrazione dei ricavi aziendali d l per punto vendita d è un ffattore di d rischio, h in quanto i ricavi complessivi sono legati solo a pochi punti vendita vendita. In questa situazione è sufficiente la chiusura di un punto vendita per ridurre fortemente le vendite totali Al contrario, un basso grado di concentrazione indica che i ricavi complessivi sono distribuiti su tuttii i puntii vendita. di Il rischio i hi è b basso Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 10 Rappresentazione grafica Q Tutti i punti di coordinate (Fi, Qi) si ttrovano o a oa all’interno te o del de quadrato di lato 1 (perché 0 ≤ Fi ≤ 1 e 0 ≤ Qi ≤ 1 ) 1 0 1 F Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 11 Rappresentazione grafica Q 1 retta di equidistribuzione Fi=Qi 45° 0 1 F Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 12 Rappresentazione grafica Q 1 Qi 0 Tutti i punti di coordinate (Fi, Qi) si trovano al di sotto della retta a 45° (perché Fi ≥ Qi ) (Fi,Qi) Fi 1 F Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 13 Rappresentazione grafica Q 1 Fi Qi 0 = Fi - Qi ((Fi,Qi) Fi 1 F Il grado d di concentrazione è tanto maggiore quanto maggiore è la distanza verticale di ogni punto dalla retta di equidistribuzione Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 14 Curva di Lorenz Qi 1 Unendo tutti i punti ((Fi, Qi) si p ottiene la curva di Lorenz (Fi,Q Qi) 0 1 Fi Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 15 Area di concentrazione Qi 1 0 L’area compresa tra L’ t la l retta tt di equidistribuzione e la curva di Lorenz si chiama area di concentrazione 1 Fi L’area è tanto più ampia quanto maggiore è il grado di concentrazione Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 16 Concentrazione nulla Qi La curva di Lorenz coincide con la retta di equidistribuzione L’area di concentrazione è nulla Fi Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 17 Concentrazione massima Qi F H G La curva di Lorenz L L coincide con i cateti FG e GH del triangolo rettangolo L’area di concentrazione è i e parii a ½ (è Fi massima l’area del triangolo rettangolo) Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 18 Confronto tra due curve di Lorenz Qi 1 0 1 Fi La curva rossa, più vicina alla retta di equidistribuzione, equidistribuzione segnala un grado di concentrazione inferiore a quello corrispondente alla curva blu Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 19 Concentrazione per una distrib. di freq. con classi di valori Classi di valori Frequenze Intensità globali (conosciute) xj –| xj+1 nj Xj x1 –|| x2 x2 –| x3 … xj –|| xj+1 … xK –|| xK+1 n1 n2 X1 X2 nj Xj nK XK L’ammontare del carattere detenuto complessivamente dalle nj unità Ognuna d O delle ll nj unità ità detiene un ammontare del carattere compreso tra xj e xj+1 Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 20 E Esempio: i R Reddito ddit d delle ll ffamiglie i li (mgl.€) Classi di reddito xj –|| xj+1 Numero di famiglie nj Intensità fino a 20 20 –| 25 25 –|| 30 30 –| 35 35 –| 40 oltre 40 3 5 4 2 3 3 20 38 115 111 66 117 157 604 conosciute Xj Le tre famiglie della prima classe hanno complessivamente l un reddito pari a 38 mgl. € Ciascuna di loro ha un reddito non superiore a 20 mgl. g €. Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 21 Calcolo di Fj Per una distribuzione di frequenza, Nj Fj = n j = 1,2,...K Nj sono le frequenze cumulate F1 = N1 , n F2 = N2 , n ...., FK = NK =1 n Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 22 Calcolo di Qi Definendo le intensità à assolute cumulate come A1=X1 ….. Aj=X1+X2+…+Xj ….. AK=X1+X2+…+XK (ammontare complessivo del carattere)) Aj Qj = , j = 1,2,..., K AK cioè A1 A2 AK Q1 = , Q2 = , ... , QK = =1 AK AK AK Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 23 Esempio: Reddito delle famiglie Classi di reddito xj –|| xj+1 fino a 20 20 –| 25 25 –|| 30 30 –| 35 35 –|| 40 oltre 40 Numero Intensità Freq. Fj=Nj/ di cumul. n conosciute famiglie g Xj Nj nj 3 5 4 2 3 3 20 38 115 111 66 117 157 604 3 8 12 14 17 20 0,15 0,40 0,60 , 0,70 0,85 1 Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 24 Esempio: Reddito delle famiglie Classi di reddito xj –|| xj+1 Numero di famiglie nj Intensità Xj Freq. cumul. Nj Fi= Nj/n Intens. cumul. Aj Qj= Aj/AK fino a 20 3 38 3 0,15 38 0,06 20 –|| 25 5 115 8 0,40 , 153 0,25 , 25 –| 30 4 111 12 0,60 264 0,44 30 –| 35 2 66 14 0,70 330 0,55 35 –| 40 3 117 17 0,85 447 0,74 oltre 40 3 157 20 1 604 1 20 604 conosciute Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 25 Rappresentazione grafica Qj 1 Q5 Q4 Q3 Q2 Q1 0 F1 F2 F3 F4 F5 1 Fj Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 26 Spezzata di concentrazione Qj 1 Q5 Q4 Q3 Q2 Q1 0 F1 F2 F3 F4 F5 1 Fj Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 27 Area di concentrazione Qj 1 A = Area di concentrazione 0 ≤ A ≤1 2 A 0 1 Fj Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 28 Calcolo dell’area dell area di concentrazione Qj H L’area di L’ concentrazione A si può ottenere come differenza tra l’area dell’intero triangolo FGH ((in rosso)) e… A Area del triangolo FGH = F G Fj Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 1 2 29 Calcolo dell’area dell area di concentrazione Qj H 1 L area di concentrazione A L’area si può ottenere come differenza tra l’area dell’intero dell intero triangolo FGH (in rosso) e… …e l’area della figura in blu A F G F j Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 30 Calcolo dell’area dell area di concentrazione Qj 1 Q5 Q4 L’area in blu è formata da un triangolo e da trapezi Q3 Q2 Q1 0 F1 F2 F3 F4 F5 1 Fj Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 31 Calcolo dell’area dell area di concentrazione Qj 1 Area del triangolo = Q5 F1Q1 2 Q4 Q3 Q2 Q1 0 F1 F2 F3 F4 F5 1 Fj Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 32 Calcolo dell’area dell area di concentrazione Qj 1 A Area del d l primo i trapezio t i = Q5 = Q4 (Q2 + Q1 )(F2 − F1 ) 2 Q3 Q2 Q1 0 F1 F2 F3 F4 F5 1 Fj Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 33 Calcolo dell’area dell area di concentrazione Qj 1 A Area del d l secondo d trapezio t i = Q5 = Q4 (Q3 + Q2 )(F3 − F2 ) 2 Q3 Q2 Q1 0 F1 F2 F3 F4 F5 1 Fj Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 34 Calcolo dell’area dell area di concentrazione Ponendo F0=0 e Q0=0, 1 l’area della figura in blu si può scrivere come K −1 ∑ (F j o j= j+1 − Fj )(Q j+1 + Q j ) 2 0 1 (per jj=0 0 si ottiene l’area del triangolo, per j=1 l’area del primo trapezio,…) trapezio ) Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 35 Area di concentrazione Qj 1 K −1 1 A= − 2 A 0 1 ∑ (F j= 0 j+1 − Fj )(Q j+1 + Q j ) 2 Fj Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 36 Rapporto di concentrazione Per avere un indice che varia tra 0 e 1, si considera il doppio dell’area R = 2A = 1 − K −1 ∑ (F j= 0 j+1 − Fj )(Q j+1 + Q j ) 0 ≤ R ≤1 R=0 → equidistribuzione R=1 → massima concentrazione Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 37 Esempio: Reddito delle famiglie Fj Qi 0,15 0,40 , 0,60 0,70 0,85 1 0,06 0,25 0,44 , 0,55 0,74 1 Fj+1-Fj Qj+1+Qj (Fj+1-Fj)(Qj+1+Qj) 0,15 0,25 0,20 , 0,10 0,15 0,15 0,06 0,31 0,69 , 0,99 1,29 1,74 0,009 0,078 0,138 , 0,099 0,194 0,261 Σ=0 779 Σ=0,779 R = 1 - 0,779 = 0,221 Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 38 Concentrazione per una distrib. di freq. con classi di valori Classi di valori Frequenze Intensità globali (stimate) xj –| xj+1 nj x’jnj x1 –|| x2 x2 –| x3 … xj –| xj+1 … xK –| xK+1 n1 n2 X1=x =x’1n1 X2=x’2n2 nj nK Xj=x’j nj XK=x =x’KnK x j + x j+1 x = 2 ' j valore centrale della classe Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 39 Esempio: Aziende per numero di addetti Classi di addetti xj –| xj+1 1 –|| 5 5 –| 10 10 –|| 50 50 –| 100 100 –| 500 Numero Intensità di h aziende x’jnj x nj 9 10 18 27 2 66 27 75 540 2025 600 3267 Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 40 Esempio: Aziende per numero di addetti Classi di addetti xj –| xj+1 Numero di aziende nj 1 –|| 5 9 10 18 27 2 66 5 –| 10 10 –| 50 50 –|| 100 00 100 –| 500 Intensità Freq. Fj=Nj/ h cumul. n x’jnj Nj 27 75 540 2025 600 3267 9 19 37 64 66 0,14 0 14 0,29 0,56 0 97 0,97 1 Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 41 Esempio: Aziende per numero di addetti Classi di addetti xj –| xj+1 1 –|| 5 5 –| 10 10 –| 50 50 –| 100 100 –| 500 Numero Intensità Freq. di h cumul. aziende i d x’jnj Nj nj 9 10 18 27 2 66 27 75 540 2025 600 3267 9 19 37 64 66 Fj= Nj/n Intensità cumul. Aj Qj= Aj/AK 0,14 0 14 0,29 0,56 0,97 1 27 102 642 2667 3267 0,01 0 01 0,03 0,20 0,82 1 Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 42 Esempio: Aziende per numero di addetti Fj 0,14 , 0,29 0 56 0,56 0,97 1 Qj Fj+1-Fj Qj+1+Qj (Fj+1-Fj)(Qj+1+Qj) 0,01 , 0,14 , 0,01 , 0,001 , 0,03 0,15 0,04 0,006 0 20 0,27 0,20 0 27 0 23 0,23 0 062 0,062 0,82 0,41 1,02 0,418 1 0,03 1,82 0,055 Σ=0,542 , R = 1 - 0,542 = 0,458 Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 43 Un’applicazione dell’ Indice di Gini: Disuguaglianza dei redditi in Italia Diseguaglianza dei redditi per regione (Indice di concentrazione di Gini sui redditi netti familiari esclusi i fitti imputati) Anno 2009 Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti Diseguaglianza dei redditi nei paesi Ue (Indice di concentrazione di Gini sui redditi netti familiari esclusi i fitti imputati) Anno 2009 Corso di Statistica a.a. 2013-2014 – DEIM, Univ.TUSCIA - Prof.ssa Laureti