Anno accademico 2016-’17 Corso di Statistica Germana Scepi Lezione: 6-7 Argomento: [email protected] Gli indici di forma e il Boxplot Università di Napoli Federico II, DISES, A.a. 2016-’17, Corso di Statistica Lezione 6-7 – Gli indici di forma e il Boxplot Gli indici sintetici G. Scepi Posizione Variabilità Forma La posizione e la variabilità di una distribuzione di frequenza non esauriscono le informazioni contenute nei dati; Due variabili statistiche possono avere la stessa posizione e la stessa variabilità ma differire per il peso dei valori più grandi o più piccoli rispetto al valore centrale, a causa del comportamento differenziato delle “code” della distribuzione (Piccolo, 2004, pag. 121). 2 Università di Napoli Federico II, DISES, A.a. 2016-’17, Corso di Statistica Lezione 6-7 – Gli indici di forma e il Boxplot Gli indici sintetici Distribuzione simmetrica rettangolare Moda=Mediana=Media G. Scepi Posizione Variabilità Forma Distribuzione simmetrica campanulare Moda=Mediana=Media 3 Università di Napoli Federico II, DISES, A.a. 2016-’17, Corso di Statistica Lezione 6-7 – Gli indici di forma e il Boxplot Gli indici sintetici Distribuzione asimmetrica positiva Moda<Mediana<Media G. Scepi Posizione Variabilità Forma Distribuzione asimmetrica negativa Moda>Mediana>Media 4 Università di Napoli Federico II, DISES, A.a. 2016-’17, Corso di Statistica Lezione 6-7 – Gli indici di forma e il Boxplot G. Scepi Posizione Variabilità Forma Gli indici sintetici Simmetria Moda=Mediana=Media Asimmetria positiva Moda<Mediana<Media Asimmetria negativa Media<Mediana<Moda Indice normalizzato di asimmetria: Indice di asimmetria di Fisher: Me I1 3 3 1 3 3 xi n i 5 Università di Napoli Federico II, DISES, A.a. 2016-’17, Corso di Statistica Lezione 6-7 – Gli indici di forma e il Boxplot G. Scepi I valori anomali Età studenti del Corso 25 26 27 28 29 30 61 Frequenze assolute (ni) M X 3 6 8 5 5 3 1 31 25 3 26 6 27 8 28 5 29 5 30 3 61 1 31 75 156 216 140 145 90 61 883 = 28,48 anni 33 31 Mediana e Quartili 3 6 5 8 5 3 1 25 25 25 26 26 26 26 26 26 27 27 27 27 27 27 27 27 28 28 28 28 28 29 29 29 29 29 30 30 30 61 Q1 = 26 Q1 Q2=Me Q3 Med= 27 Dati anomali: Q3 = 29 a) Q3 + 1,5 (Q3-Q1) = 29 + 1,5×3 = 33,5 Q3 -Q1 = 29-26 = 3 b) Q1 - 1,5 (Q3-Q1) = 26 - 1,5×3 = 21,5 6 Università di Napoli Federico II, DISES, A.a. 2016-’17, Corso di Statistica Lezione 6-7 – Gli indici di forma e il Boxplot G. Scepi Un “riepilogo grafico” sulla variabilità: il boxplot Frequenze assolute (ni) Età studenti del Corso 25 26 27 28 29 30 61 a) Q1 = 26 Med= 27 3 6 8 5 5 3 1 31 Q3 = 29 Q3 -Q1 = 29-26 = 3 Senza il dato anomalo b) Con il dato anomalo 31 Min 24 25 Q1 26 Q2 27 28 Q3 Max 29 30 31 20 30 40 50 60 70 7 Università di Napoli Federico II, DISES, A.a. 2016-’17, Corso di Statistica Lezione 6-7 – Gli indici di forma e il Boxplot G. Scepi Boxplot e Istogramma Età studenti del Corso Q1 = 26 Med= 27 3 6 8 5 5 3 1 31 Q3 = 29 Q3 -Q1 = 29-26 = 3 % 25 26 27 28 29 30 61 Frequenze assolute (ni) 30 20 10 0 24 25 26 27 28 29 30 31 25 26 27 28 29 30 8 Università di Napoli Federico II, DISES, A.a. 2016-’17, Corso di Statistica Lezione 6-7 – Gli indici di forma e il Boxplot G. Scepi Boxplot e Istogramma Distribuzione simmetrica rettangolare Distribuzione simmetrica campanulare 9 Università di Napoli Federico II, DISES, A.a. 2016-’17, Corso di Statistica Lezione 6-7 – Gli indici di forma e il Boxplot G. Scepi Boxplot e Istogramma Distribuzione asimmetrica positiva Distribuzione asimmetrica negativa 10