Diapositiva 1 - Docenti.unina

annuncio pubblicitario
Anno accademico 2016-’17
Corso di
Statistica
Germana Scepi
Lezione:
6-7
Argomento:
[email protected]
Gli indici di forma e il Boxplot
Università di Napoli Federico II, DISES, A.a. 2016-’17, Corso di Statistica
Lezione 6-7 – Gli indici di forma e il Boxplot
Gli indici sintetici
G. Scepi
Posizione
Variabilità
Forma
 La posizione e la variabilità di una distribuzione di frequenza non esauriscono le
informazioni contenute nei dati;
 Due variabili statistiche possono avere la stessa posizione e la stessa variabilità ma
differire per il peso dei valori più grandi o più piccoli rispetto al valore centrale, a causa del
comportamento differenziato delle “code” della distribuzione (Piccolo, 2004, pag. 121).
2
Università di Napoli Federico II, DISES, A.a. 2016-’17, Corso di Statistica
Lezione 6-7 – Gli indici di forma e il Boxplot
Gli indici sintetici
Distribuzione simmetrica
rettangolare
Moda=Mediana=Media
G. Scepi
Posizione
Variabilità
Forma
Distribuzione simmetrica
campanulare
Moda=Mediana=Media
3
Università di Napoli Federico II, DISES, A.a. 2016-’17, Corso di Statistica
Lezione 6-7 – Gli indici di forma e il Boxplot
Gli indici sintetici
Distribuzione asimmetrica
positiva
Moda<Mediana<Media
G. Scepi
Posizione
Variabilità
Forma
Distribuzione asimmetrica
negativa
Moda>Mediana>Media
4
Università di Napoli Federico II, DISES, A.a. 2016-’17, Corso di Statistica
Lezione 6-7 – Gli indici di forma e il Boxplot
G. Scepi
Posizione
Variabilità
Forma
Gli indici sintetici
Simmetria
Moda=Mediana=Media
Asimmetria positiva
Moda<Mediana<Media
Asimmetria negativa
Media<Mediana<Moda
Indice normalizzato di
asimmetria:
Indice di asimmetria di
Fisher:
  Me
I1 


3
 3

1
3
3    xi   
n i
5
Università di Napoli Federico II, DISES, A.a. 2016-’17, Corso di Statistica
Lezione 6-7 – Gli indici di forma e il Boxplot
G. Scepi
I valori anomali
Età studenti
del Corso
25
26
27
28
29
30
61
Frequenze
assolute
(ni)
M X  
3
6
8
5
5
3
1
31
25  3  26  6   27  8   28  5  29  5  30  3  61  1

31
75  156  216  140  145  90  61
883 = 28,48 anni

33
31
Mediana e Quartili
3
6
5
8
5
3
1
25 25 25 26 26 26 26 26 26 27 27 27 27 27 27 27 27 28 28 28 28 28 29 29 29 29 29 30 30 30 61
Q1 = 26
Q1
Q2=Me
Q3
Med= 27
Dati anomali:
Q3 = 29
a)
Q3 + 1,5 (Q3-Q1) = 29 + 1,5×3 = 33,5
Q3 -Q1 = 29-26 = 3
b)
Q1 - 1,5 (Q3-Q1) = 26 - 1,5×3 = 21,5
6
Università di Napoli Federico II, DISES, A.a. 2016-’17, Corso di Statistica
Lezione 6-7 – Gli indici di forma e il Boxplot
G. Scepi
Un “riepilogo grafico” sulla variabilità: il boxplot
Frequenze
assolute
(ni)
Età studenti
del Corso
25
26
27
28
29
30
61
a)
Q1 = 26
Med= 27
3
6
8
5
5
3
1
31
Q3 = 29
Q3 -Q1 = 29-26 = 3
Senza il dato anomalo
b)
Con il dato anomalo
31
Min
24
25
Q1
26
Q2
27
28
Q3
Max
29
30
31
20
30
40
50
60
70
7
Università di Napoli Federico II, DISES, A.a. 2016-’17, Corso di Statistica
Lezione 6-7 – Gli indici di forma e il Boxplot
G. Scepi
Boxplot e Istogramma
Età studenti
del Corso
Q1 = 26
Med= 27
3
6
8
5
5
3
1
31
Q3 = 29
Q3 -Q1 = 29-26 = 3
%
25
26
27
28
29
30
61
Frequenze
assolute
(ni)
30
20
10
0
24
25
26
27
28
29
30
31
25
26
27
28
29
30
8
Università di Napoli Federico II, DISES, A.a. 2016-’17, Corso di Statistica
Lezione 6-7 – Gli indici di forma e il Boxplot
G. Scepi
Boxplot e Istogramma
Distribuzione simmetrica
rettangolare
Distribuzione simmetrica
campanulare
9
Università di Napoli Federico II, DISES, A.a. 2016-’17, Corso di Statistica
Lezione 6-7 – Gli indici di forma e il Boxplot
G. Scepi
Boxplot e Istogramma
Distribuzione asimmetrica
positiva
Distribuzione asimmetrica
negativa
10
Scarica