Corso di Statistica Esercitazione 1.3 Indici di variabilità ed eterogeneità Concentrazione Asimmetria Prof.ssa T. Laureti a.a. 2014-2015 Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 1 1 Esercizio 1 Si considerino i seguenti dati relativi al numero di addetti nelle imprese presenti in un determinato comune 7 5 8 4 11 9 15 18 10 6 3 19 12 14 9 Determinare: • la media aritmetica • • • la mediana il range la varianza 2 Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti a) Calcolo della media aritmetica Per un insieme di n=15 valori osservati del carattere quantitativo “addetti” la formula della media aritmetica è la seguente: 1 1 n xa (x1 x2 ... xn ) xi n n i1 Quindi: 7 5 8 4 11 9 15 18 10 6 3 19 12 14 9 1 xa 7 5 8 ... 9 10 15 3 Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti b) Calcolo della mediana Per individuare la posizione mediana è necessario ordinare le osservazioni in senso non decrescente: 3 4 5 6 7 8 9 9 10 11 12 14 15 18 19 Posizione mediana La posizione centrale per n dispari (n=15) è data da (n 1) 16 8 2 2 Quindi Me=9 4 Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti Addetti xj 7 5 8 4 11 d) Calcolo del range L’indice di variabilità range espresso dalla differenza tra il valore massimo e il valore minimo della distribuzione, ossia range xmax xmin 9 15 Nella distribuzione considerata si ha: 18 10 6 3 19 12 14 Min=3 Max=19 Quindi: range 19 3 16 9 5 Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti Addetti xi Scarti dalla media (xi-μ) d) Calcolo della varianza Quadrato degli scarti (xi-μ)2 7 -3 9 5 -5 25 8 -2 4 4 -6 36 11 1 1 9 -1 1 15 5 25 18 8 64 10 0 0 6 -4 16 3 -7 49 19 9 81 12 2 4 14 4 16 9 -1 1 n 2 x x i Dev(X) 332 i1 1 n 332 2 xi x 22,13 n i 1 15 2 1 n 2 x x i n i1 22,13 4,70 Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 6 Esercizio 2. La seguente distribuzione riporta il numero di chilometri percorsi in una settimana da 31 rappresentanti di commercio di una nota marca di occhiali da sole . Classi di chilometri [400 – 450) [ 450 - 500) [ 500 - 550) [ 550 - 600) [ 600 - 650) totale 6 9 7 6 3 31 Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 7 A) Calcolare le frequenze relative, le frequenze percentuali e le frequenze relative cumulate B) Determinare il numero medio di chilometri percorsi. C) Calcolare la mediana e il primo quartile. D) Misurare la variabilità della distribuzione utilizzando la deviazione standard 8 Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti A) Calcolo delle frequenze relative, frequenze percentuali e relative cumulate 6 f1 0,194 31 Classi di chilometri [400 – 450) [ 450 - 500) [ 500 - 550) [ 550 - 600) [ 600 - 650) totale 9 f 2 0,290 31 nj 6 9 7 6 3 31 fj pj 0,194 19,4 0,290 29,0 0,226 22,6 0,194 19,4 0,097 9,7 1,000 100,0 Fj 0,194 0,484 0,710 0,903 1,000 Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 9 B) Calcolo della media aritmetica Classi di chilometri x j x j 1 [400 – 450) [ 450 - 500) [ 500 - 550) [ 550 - 600) [ 600 - 650) totale nj 6 9 7 6 3 31 cj*nj Valore centrale classi (cj) 425 475 525 575 625 2.550 4.275 3.675 3.450 1.875 15.825 K xa c n j j 1 n j 15.825 510,48 31 Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 10 C) Calcolo della mediana 1. Individuazione della classe mediana Classi di chilometri nj [400 – 450) [ 450 - 500) [ 500 - 550) [ 550 - 600) [ 600 - 650) totale 6 9 7 6 3 31 n 1 31 1 rango mediana 16 2 2 Fj Nj 6 15 22 28 31 0,194 0,484 0,710 0,903 1,000 La mediana è contenuta nella classe 500-550 11 C) Calcolo della mediana 2. Individuazione della mediana nella classe sotto l’ipotesi di distribuzione uniforme (applicazione della formula) 0,5 Fm1 m Me I m Fm Fm1 Classi di chilometri nj Nj [400 – 450) [ 450 - 500) 6 9 [ 500 - 550) [ 550 - 600) [ 600 - 650) 7 6 3 31 6 0,194 15 0,484 22 0,710 28 0,903 31 1,000 totale Fj Im=estr inf della classe mediana=500 Fm-1=freq rel cum fino alla classe precedente a quella mediana =0,484 Fm=freq rel cum fino alla classe mediana=0,710 Δm=ampiezza della classe mediana= =550-500=50 0,5 Fm1 0,5 0,484 m 500 Me I m 50 503,57 12 0,710 0,484 Fm Fm1 Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti C) Calcolo del primo quartile Q1 è il primo valore xi in corrispondenza del quale la frequenza cumulata relativa Fj 0,25 Classi di chilometri nj Fj Nj [400 – 450) 6 6 0,194 [ 450 - 500) 9 15 0,484 [ 500 - 550) 7 22 0,710 [ 550 - 600) 6 28 0,903 [ 600 - 650) 3 31 1,000 totale 31 0, 25 FQ1 1 0, 25 0,194 Q1 I Q1 450 50 459, 72 Q1 FQ FQ 1 0, 484 0,194 1 1 Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 13 D) Calcolo della deviazione standard Classi di chilometri [400 – 450) [ 450 - 500) [ 500 - 550) [ 550 - 600) [ 600 - 650) totale xa 510,48 nj Valore centrale classi (cj) 6 9 7 6 3 31 (cj-μ)2 425 7306,8 475 1258,8 210,8 525 575 4162,8 625 13114,8 (cj-μ)2*nj 43840,8 11329,2 1475,6 24976,8 39344,4 120966,8 1 K 120966,8 2 c j x nj 3902,15 n j1 31 2 3902,15 62,47 14 Esercizio 3 Si consideri la seguente distribuzione di 100 imprese per classi di fatturato: Classi di fatturato (migliaia di euro) N. imprese (0-20] (20-50] 30 50 (50-100] Totale 20 100 a) Rappresentare graficamente la distribuzione b) Determinare la moda Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 15 a) Costruzione dell’istogramma. Le classi hanno diversa ampiezza. E’ necessario calcolare la densità di frequenza Classi di fatturato (migliaia di euro) nj Ampiezza classe (aj) Densità di freq (hj) 0-20 30 20 1,5 20-50 50 30 1,67 50-100 20 50 0,4 Totale 100 b) La classe modale è quella che ha la densità di frequenza maggiore. Quindi la classe modale è 20-50 16 Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti ISTOGRAMMA hi 1,7 1,5 0,4 0 20 50 100 17 Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti Esercizio 4 Si consideri la distribuzione degli alunni della scuola secondaria di primo grado per giudizio riportato all’esame di Stato nell’Anno scolastico 2006/07 in Italia (dati Istat) Giudizio Licenziati Sufficiente 37,1 Buono 26,4 Distinto 19,2 Ottimo 17,3 100,0 Determinare la moda e la mediana. Misurare l’eterogeneità della distribuzione 18 Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti Si tratta di una distribuzione percentuale Giudizio Licenziati Sufficiente 37,1 0,371 0,371 Buono 26,4 0,264 0,635 Distinto 19,2 0,192 0,827 Ottimo 17,3 0,173 1 100,0 1,000 Fj fj La moda, ossia la modalità più frequente è sufficiente Per il calcolo della mediana sulla colonna delle frequenze relative cumulate si individua la prima Fj che è uguale o maggiore di 0,5 La mediana è Buono 19 Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti b) Eterogeneità della distribuzione Giudizio Licenziati Sufficiente 37,1 0,371 0,1376 Buono 26,4 0,264 0,0697 Distinto 19,2 0,192 0,0369 Ottimo 17,3 0,173 0,0299 100,0 1,000 0,2741 f2j fj K E1 1 f j2 1 0,2741 0,7259 j 1 0 E1 K 1 3 0,75 K 4 0,7259 e1 0,968 0,75 Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 20 Esercizio 1 Le retribuzioni, in migliaia di euro, di 5 dipendenti di un grande magazzino risultano le seguenti: 10 20 28 8 14 a) Disegnare la curva di Lorenz; b) Misurare la concentrazione. 21 Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti Per la distribuzione precedente è necessario ordinare innanzitutto le intensità del carattere. Quindi si procede al calcolo di Fi e Qi Retribuzioni (valori ordinati) Intens. ass. cum. Ai Freq. rel. cum. Fi Intens. rel. cum. Qi Fi - Qi 8 8 0,20 0,100 0,100 10 18 0,40 0,225 0,175 14 32 0,60 0,400 0,200 20 52 0,80 0,650 0,150 28 80 1,00 1,000 Fi i 3 n 5 Ai 32 Qi A n 80 22 Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti a) Curva di Lorenz Qi 1,000 superficie di concentrazione 0,650 0,400 0,225 0,100 0,2 0,4 0,6 0,8 1,0 Fi n-1 b) R (F Q ) i 1 i i n 1 F i 1 i = 0, 625 =0,3125 2 Si è in presenza di una modesta concentrazione23 Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti Esercizio 2 Si consideri la seguente distribuzione delle industrie del legno per classi di fatturato in migliaia e fatturato totale per classe (milioni): Classi di fatturato nJ Fatturato totale 0-5 750 1.930 5-10 420 3.260 10-25 390 6.350 25-50 180 5.450 Oltre 50 150 76.400 1.890 Determinare il rapporto di concentrazione. 24 Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti Per il calcolo dell’indice di concentrazione deve essere utilizzato il fatturato totale che è noto (intensità) Classi di fatturato nJ Nj Fatturato totale (intensità Aj) Fi= Nj/n Qj= Aj/AK 0-5 750 750 1.930 0,397 0,021 5-10 420 1170 5.190 0,619 0,056 10-25 390 1560 11.540 0,825 0,124 25-50 180 1740 16.990 0,921 0,182 Oltre 50 150 1890 93.390 1,000 1,000 1.890 25 Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti Quindi: Classi di fatturato Fi= Nj/n Qj= Aj/AK Fj+1-Fj Qj+1+Qj (Fj+1-Fj)(Qj+1+Qj) 0-5 0,397 0,021 0,397 0,021 0,008 5-10 0,619 0,056 0,222 0,076 0,017 10-25 0,825 0,124 0,206 0,179 0,037 25-50 0,921 0,182 0,095 0,305 0,029 Oltre 50 1,000 1,000 0,079 1,182 0,094 0,185 R = 1 – 0,185 = 0,815 Elevata concentrazione del fatturato tra le imprese 26 Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti Esercizio 3 Si consideri la seguente distribuzione delle famiglie per classi di reddito mensile in migliaia di euro Classi di reddito Famiglie nj 0-2 2 2-6 4 6-8 3 8-10 1 10 A) Disegnare la curva di Lorenz B) Misurare la concentrazione del reddito 27 Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti Classi nJ cj Nj Fi= Nj/n Aj cj*nj Qj= Aj/AK 0-2 1 2 2 0,2 2 2-6 4 4 6 0,6 16 18 18/48=0,375 6-8 7 3 9 0,9 21 39 39/48=0,813 8-10 9 1 10 1,0 9 48 48/48=1,000 10 2 2/48=0,042 48 1,000 Qi superficie di concentrazione 0,813 0,375 Pi 0,042 0,2 28 0,6 0,9 1,0 Classi Fi= Nj/n Qj= Aj/AK (Fj+1- Fj) (Qj+1+Qj) (Fj+1Fj)(Qj+1+Qj) 0-2 0,2 0,042 0,2 0,042 0,0084 2-6 0,6 0,375 0,4 0,417 0,1668 6-8 0,9 0,813 0,3 1,188 0,3564 8-10 1,0 1,000 0,1 1,813 0,1813 k 1 R 1 F j 1 F j Q j 1 Q j 1 0,7129 j 0 R 0,2871 Modesta concentrazione 29 Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti Esercizio 4 Si consideri la seguente distribuzione di 20 imprese secondo il numero di addetti: Addetti N. imprese 1 10 3 5 5 3 10 2 20 Misurare l’asimmetria della distribuzione 30 Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti Si può procedere ad una rappresentazione grafica per valutare il grado di simmetria della distribuzione Imprese secondo il numero di addetti 12 10 8 6 4 2 0 1 3 5 10 31 Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti Addetti x NJ N. imprese j X x 3 j X 1 10 10 -8 -80 3 5 15 0 0 5 3 18 8 24 10 2 20 343 686 2,74 M3 3 j 630 20 X 3 n 3 Mo 1 Me 1 630 20 1, 531 20,571 La distribuzione è asimmetrica positiva Corso di Statistica a.a. 2014-2015 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 32 Indagine Bankitalia sul reddito delle famiglie italiane nel 2006 (tiene conto della composizione demografica della famiglia) entrambe le distribuzioni sono asimmetriche positive 33