22/10/2012 Corso di Statistica Esercitazione 1.3 Indici di variabilità ed eterogeneità Concentrazione Asimmetria Prof.ssa T. Laureti a.a. 2012-2013 Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 1 1 1 22/10/2012 Esercizio 1 Si considerino i seguenti dati relativi al numero di addetti nelle imprese presenti in un determinato comune 7 5 8 4 11 9 15 18 10 6 3 19 12 14 9 Determinare: • la media aritmetica • • • lla mediana di il range la varianza 2 Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 2 22/10/2012 a) Calcolo della media aritmetica Per un insieme di n=15 valori osservati del carattere quantitativo “addetti” addetti la formula della media aritmetica è la seguente: 1 1 n x a = (x 1 + x 2 + ... + x n ) = ∑ x i n n i =1 Q i di Quindi: 7 5 8 4 11 9 15 18 10 6 3 19 12 14 9 1 xa = (7 + 5 + 8 + ... + 9 ) = 10 15 3 Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 3 22/10/2012 b) Calcolo della mediana Per individuare la posizione mediana è necessario ordinare le osservazioni in senso non decrescente: 3 4 5 6 7 8 9 9 10 11 12 14 15 18 19 Posizione mediana L posizione La i i centrale t l per n di disparii ((n=15) 15) è d data t d da (n + 1) 16 = =8 2 2 Quindi Me=9 4 Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 4 22/10/2012 Addetti xj 7 5 8 4 11 d) Calcolo del range L’indice di variabilità range espresso dalla differenza tra il valore massimo e il valore minimo della distribuzione, ossia range = xmax − xmin 9 15 Nella distribuzione considerata si ha: 18 10 6 3 19 12 14 Mi 3 Min=3 M Max=19 19 Quindi: range = 19 − 3 = 16 9 5 Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 5 22/10/2012 Addetti xi Scarti dalla media (xi-µ) d) Calcolo della varianza Quadrato degli scarti (xi-µ)2 7 -3 9 5 -5 25 8 -2 2 4 4 -6 36 11 1 1 9 -1 1 1 15 5 25 18 8 64 10 0 0 6 -4 16 3 -7 7 49 19 9 81 12 2 4 14 4 16 9 -1 1 n 2 ( ) x − x ∑ i = Dev(X) = 332 i=1 1 n 332 2 σ = ∑ ( xi − x ) = = 22,13 n i =1 15 2 1 n 2 ( ) σ = x − x = ∑ i n i=1 = 22,13 = 4,70 6 Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 6 22/10/2012 Esercizio 2. La seguente distribuzione riporta il numero di chilometri percorsi in una settimana da 31 rappresentanti di commercio di una nota marca di occhiali da sole . Classi di chilometri [400 – 450) [ 450 - 500) [ 500 - 550) [ 550 - 600) [ 600 - 650)) totale 6 9 7 6 3 31 7 Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 7 22/10/2012 A) Calcolare le frequenze relative, le frequenze percentuali e le frequenze relative cumulate B) Determinare il numero medio di chilometri percorsi. percorsi C) Calcolare la mediana e il primo quartile. D) Misurare la variabilità della distribuzione utilizzando la deviazione standard 8 Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 8 22/10/2012 A) Calcolo delle frequenze relative, frequenze percentuali e relative cumulate f1 = 6 = 0,194 31 Classi di chilometri [400 – 450) [ 450 - 500) [ 500 - 550) [ 550 - 600) [ 600 - 650)) totale f2 = 9 = 0,290 … 31 nj 6 9 7 6 3 31 fj pj 0,194 19,4 0,290 29,0 0,226 22,6 0,194 19,4 0,097 9,7 , 1,000 100,0 Fjj 0,194 0,484 0,710 0,903 1,000 9 Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 9 22/10/2012 B) Calcolo della media aritmetica Classi di chilometri x j − x j +1 [400 – 450) [ 450 - 500)) [ 500 - 550) [ 550 - 600) [ 600 - 650) totale nj 6 9 7 6 3 31 cj*nj Valore centrale classi (cj) 425 475 525 575 625 2.550 4.275 3.675 3.450 1.875 15 825 15.825 K xa ≈ ∑c n j j =1 n j = 15.825 = 510,48 31 10 Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 10 22/10/2012 C) Calcolo della mediana 1. Individuazione della classe mediana Classi di chilometri nj [400 – 450) [ 450 - 500) [ 500 - 550) [ 550 - 600) [ 600 - 650) t t l totale 6 9 7 6 3 31 rango mediana = n + 1 31 + 1 = = 16 2 2 Fj Nj 6 15 22 28 31 0,194 0 484 0,484 0,710 0 903 0,903 1,000 La mediana è contenuta nella classe 500-550 11 Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 11 22/10/2012 C) Calcolo della mediana 2. Individuazione della mediana nella classe sotto l’ipotesi di distribuzione uniforme (applicazione della formula) ⎛ 0,5 − Fm −1 ⎞ ⎟⎟∆ m Me ≈ I m + ⎜⎜ F − F m −1 ⎠ ⎝ m Classi di chilometri nj Nj [400 – 450) [ 450 - 500) 6 9 [ 500 - 550) 7 6 0,194 15 0,484 22 0,710 [ 550 - 600) 6 [ 600 - 650) 3 totale 31 Fj 28 0,903 1 000 31 1,000 Im=estr inf della classe mediana=500 Fm-1=freq rel cum fino alla classe precedente a quella mediana =0,484 Fm=freq freq rel cum fino alla classe mediana=0,710 ∆m=ampiezza i d della ll classe mediana= =550-500=50 ⎛ 0,5 − Fm −1 ⎞ ⎛ 0,5 − 0,484 ⎞ ⎜ Me ≈ I m + ⎜ ∆ m = 500 + ⎜ ∗ 50 = 503,57 ⎟ 12 ⎝ 0,710 − 0,484 ⎠ ⎝ Fm − Fm −1 ⎠ Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 12 22/10/2012 C) Calcolo del primo quartile Q1 è il primo i valore l xii in i corrispondenza i d d dell quale l la frequenza cumulata relativa Fj ≥ 0,25 Classi di chilometri nj Fj Nj [400 – 450) 6 6 0,194 [ 450 - 500) 9 15 0,484 [ 500 - 550) 7 22 0 710 0,710 [ 550 - 600) 6 28 0,903 [ 600 - 650) 3 31 1,000 totale 31 ⎛ 0, 25 − FQ1 −1 ⎞ , ⎛ 0,, 25 − 0,194 ⎞ Q1 ≈ I Q1 + ⎜ ∆ = 450 + 459, 72 ⎟ ⎜ 0, 484 − 0,194 ⎟ 50 = 459 ⎜ FQ − FQ −1 ⎟ Q1 ⎝ ⎠ 1 ⎝ 1 ⎠ 13 Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 13 22/10/2012 D) Calcolo della deviazione standard Classi di chilometri [400 – 450) [ 450 - 500) [ 500 - 550) [ 550 - 600) [ 600 - 650) totale xa = 510,48 nj Valore centrale classi (cj) 6 9 7 6 3 31 (cj-µ)2 425 7306,8 475 1258,8 210,8 525 575 4162,8 625 13114,8 (cj-µ)2*nj 43840,8 11329,2 1475,6 24976,8 39344,4 120966,8 1 K 120966,8 , 2 σ = ∑ (c j − x ) nj = = 3902,15 3902 15 n j=1 31 2 σ = 3902,15 = 62,47 Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 14 14 22/10/2012 Esercizio 3 Si consideri la seguente distribuzione di 100 imprese per classi di fatturato: Classi di fatturato (migliaia di euro) N. imprese p (0-20] 30 (20-50] 50 (50-100] 20 T l Totale 100 a)) Rappresentare pp g graficamente la distribuzione b) Determinare la moda 15 Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 15 22/10/2012 a) Costruzione dell’istogramma. Le classi hanno diversa ampiezza ampiezza. E’ E necessario calcolare la densità di frequenza Classi di fatturato ((migliaia g di euro)) nj Ampiezza classe (aj) Densità di q freq (hj) 0 20 0-20 30 20 15 1,5 20-50 50 30 1,67 50-100 20 50 0,4 Totale 100 b) La classe modale è quella che ha la densità di frequenza maggiore. Quindi la classe modale è 20-50 16 Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 16 22/10/2012 ISTOGRAMMA hi 1,7 1,5 0,4 0 20 50 100 17 Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 17 22/10/2012 Esercizio 4 Si consideri la distribuzione degli g alunni della scuola secondaria di primo grado per giudizio riportato all’esame di Stato nell’Anno scolastico 2006/07 in Italia (dati Istat) Giudizio Licenziati Sufficiente 37 1 37,1 Buono 26,4 Distinto 19 2 19,2 Ottimo 17,3 100 0 100,0 Determinare la moda e la mediana. Misurare l’eterogeneità della distribuzione 18 Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 18 22/10/2012 Si tratta di una distribuzione percentuale Gi di i Giudizio Li Licenziati i ti Sufficiente 37,1 0,371 0,371 B Buono 26 4 26,4 0 264 0,264 0 635 0,635 Distinto 19,2 0,192 0,827 O i Ottimo 17 3 17,3 0 173 0,173 1 100,0 1,000 Fj fj La moda, ossia la modalità più frequente è sufficiente Per il calcolo P l l d della ll mediana di sulla ll colonna l d delle ll frequenze relative cumulate si individua la prima Fj che è uguale o maggiore di 0,5 La mediana è Buono 19 Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 19 22/10/2012 b) Eterogeneità della distribuzione Gi di i Giudizio Li Licenziati i ti Sufficiente 37,1 0,371 0,1376 B Buono 26 4 26,4 0 264 0,264 0 0697 0,0697 Distinto 19,2 0,192 0,0369 O i Ottimo 17 3 17,3 0 173 0,173 0 0299 0,0299 100,0 1,000 0,2741 f2j fj K E1 = 1 − ∑ f j2 = 1 − 0,2741 = 0,7259 j =1 e1 = 0 ≤ E1 ≤ K −1 3 = = 0,75 K 4 0,7259 = 0,968 0,75 20 Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 20 22/10/2012 Esercizio 1 Le e retribuzioni, e bu o , in migliaia g aa d di eu euro, o, d di 5 d dipendenti pe de di u d un g grande a de magazzino risultano le seguenti: 10 20 28 8 14 a) Disegnare la curva di Lorenz; b) Misurare la concentrazione. 21 Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 21 22/10/2012 Per la distribuzione precedente è necessario ordinare innanzitutto le intensità del carattere. Quindi si procede al calcolo di Fi e Qi Retribuzioni (valori ordinati) Intens. ass. cum. Ai Freq. rel. cum. Fi Intens. rel. cum. Qi Fi - Qi 8 8 0,20 0,100 0,100 10 18 0 40 0,40 0 225 0,175 0,225 0 175 14 32 0,60 0,400 0,200 20 52 0,80 0,650 0,150 28 80 1,00 1,000 Fi = i 3 = n 5 Qi = A i 32 = A n 80 22 Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 22 22/10/2012 a) Curva di Lorenz Qi 1,000 superficie di concentrazione 0,650 0,400 0,225 0 100 0,100 0,2 0,4 0,6 0,8 1,0 Fi n-1 b) R= ∑ (F − Q ) i =1 i i n −1 ∑F i =1 i = 0, 625 , =0,3125 2 Si è in presenza di una modesta concentrazione23 Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 23 22/10/2012 Esercizio 2 Si consideri la seguente g distribuzione delle industrie del legno g p per classi di fatturato in migliaia e fatturato totale per classe (milioni): Classi di fatturato Fatturato totale nJ 0-5 0 5 750 1.930 5-10 420 3.260 10-25 390 6.350 25-50 25 50 180 5 450 5.450 Oltre 50 150 76.400 1.890 Determinare il rapporto di concentrazione. 24 Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 24 22/10/2012 Per il calcolo dell’indice di concentrazione deve essere utilizzato il fatturato totale che è noto (intensità) Classi di fatturato nJ Nj Fatturato totale (intensità Aj) Fi= Nj/n Qj= Aj/AK 0-5 750 750 1.930 0,397 0,021 5-10 5 10 420 1170 5.190 0,619 0,056 10-25 390 1560 11.540 0,825 0,124 25-50 180 1740 16.990 0,921 0,182 Olt 50 Oltre 150 1890 93 390 93.390 1 000 1,000 1 000 1,000 1.890 25 Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 25 22/10/2012 Quindi: Classi di fatturato Fi= Nj/n Qj= Aj/AK Fj+1-Fj Qj+1+Qj (Fj+1-Fj)(Qj+1+Qj) 0-5 0,397 0,021 0,397 0,021 0,008 5-10 0,619 0,056 0,222 0,076 0,017 10-25 0 2 0 82 0,825 0 2 0,124 0 206 0,206 0 0,179 9 0 03 0,037 25-50 0,921 0,182 0,095 0,305 0,029 Oltre 50 1,000 1,000 0,079 1,182 0,094 0,185 R = 1 – 0,185 0 185 = 0 0,815 815 Elevata concentrazione del fatturato tra le imprese p 26 Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 26 22/10/2012 Esercizio 3 Si consideri la seguente distribuzione delle famiglie per classi di reddito mensile in migliaia di euro Classi di reddito Famiglie nj 0-2 0 2 2 2-6 4 6-8 3 8-10 1 10 A) Disegnare la curva di Lorenz B) Misurare la concentrazione del reddito 27 Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 27 22/10/2012 Classi cj nJ Nj cj*nj Fi= Nj/n Aj Qj= Aj/AK 0-2 1 2 2 0,2 2 2-6 4 4 6 0,6 16 18 18/48=0,375 6-8 6 8 7 3 9 0,9 21 39 39/48 39/48=0,813 0,813 8-10 9 1 10 1,0 9 48 48/48=1,000 10 2 2/48=0,042 48 1,000 Qi superficie di concentrazione 0,813 0,375 Pi 0,042 0,2 28 0,6 0,9 1,0 28 22/10/2012 Classi Fi= Nj/n Qj= Aj/AK (Fj+1- Fj) (Qj+1+Qj) (Fj+1Fj)(Qj+1+Qj) 0-2 0,2 0,042 0,2 0,042 0,0084 2-6 0,6 0,375 0,4 0,417 0,1668 6 8 6-8 0 9 0,813 0,9 0 813 03 0,3 1 188 1,188 0 3564 0,3564 8-10 1,0 1,000 0,1 1,813 0,1813 k −1 R = 1 − ∑ (F j +1 − F j )(Q j +1 + Q j ) = 1 − 0,7129 = j =0 R = 0,2871 Modesta concentrazione 29 Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 29 22/10/2012 Esercizio 4 o d la a seguente gu distribuzione d bu o di d 20 0 imprese p secondo o do il Si consideri numero di addetti: Addetti N. imprese 1 10 3 5 5 3 10 2 20 Misurare l’asimmetria della distribuzione 30 Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 30 22/10/2012 Si può procedere ad una rappresentazione grafica per valutare il grado di simmetria della distribuzione Imprese secondo il numero di addetti 12 10 8 6 4 2 0 1 3 5 10 31 Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 31 22/10/2012 Addetti (x NJ N imprese N. j −X ) (x 3 j − X 1 10 10 -8 -80 3 5 15 0 0 5 3 18 8 24 10 2 20 343 686 σ = 2, 2 74 β = M3 σ 3 = j 630 20 X =3 )n 3 Mo =1 Me =1 630 20 = 1, 531 20,571 La distribuzione è asimmetrica positiva 32 Corso di Statistica a.a. 2012-2013 – DEIM, Univ.TUSCIA - Prof.ssa Laureti 32 22/10/2012 Indagine Bankitalia sul reddito delle famiglie italiane nel 2006 (tiene conto (ti t della d ll composizione i i demografica della famiglia) entrambe le distribuzioni sono asimmetriche positive 33 33