Lez 2013 1B- Dispersione e tendenza centrale - e

DISPERSIONE E TENDENZA
CENTRALE
1
Dall’esame della distribuzione di frequenza, si possono desumere
alcune caratteristiche:
Le misurazioni sono concentrate sul lato sinistro (A), sul lato destro (B), al centro (C),
da nessuna parte (D) o in due punti (E).
A- Pre v ale nza di v alori bassi
B Prevalenza di valori alti
40
35
40
30
25
30
20
15
10
20
10
C- Valori concentrati nel centro
32
30
28
26
24
22
20
18
16
14
12
10
32
30
28
26
24
22
20
18
16
14
0
12
10
5
0
D - Distribuzione uniforme
40
35
16
14
12
10
8
6
4
2
0
30
25
20
15
10
5
32
30
E- distribuzione bimodale
30
25
20
2
15
10
5
32
30
28
26
24
22
20
18
16
14
12
0
10
28
26
24
22
20
18
16
14
12
10
0
LA DISTRIBUZIONE CUMULATIVA DELLE FREQUENZE
Sommando le frequenze dai valori più bassi ai valori più alti, si ottiene la
distribuzione cumulativa (o cumulata) delle frequenze:
Valori
osservati
Frequenza
Percentuale
Frequenza
cumulativa
Percentuale
comulativa
23
1
7.7
1
7.7
24
3
23.1
4
30.8
25
1
7.7
5
38.5
26
2
15.4
7
53.8
27
4
30.8
11
84.6
29
1
7.7
12
92.3
30
1
7.7
13
100.0
Totale
13
100.0
13
100.0
3
L’ogiva
Per rappresentare la distribuzione cumulativa di frequenza si usa più spesso il poligono
piuttosto che l’istogramma, e il poligono delle frequenze cumulative si chiama ogiva.
Si usano le percentuali piuttosto che le frequenze assolute:
Percentuale cumulativa
100%
80%
60%
40%
20%
0%
23
24
25
26
27
29
30
età
Ogni punto rappresenta un valore della variabile abbinato alla sua percentuale
cumulativa. L’unione di tutti i punti dà questo segmento spezzato detto ogiva.
4
ESEMPIO
Nella tabella sono mostrati i punteggi relativi a un test di abilità verbale eseguito da 635
quattordicenni. Riporta inoltre le frequenze assolute e le percentuali assolute e cumulate.
Valori
Frequenza
Percentuale
Percentuale
cumulata
4
1
,2
,2
5
1
,2
,3
7
2
,3
,6
8
9
1,4
2,0
9
6
,9
3,0
31
3
,5
98,6
32
5
,8
99,4
33
2
,3
99,7
34
1
,2
99,8
35
1
,2
100,0
Totale
635
100
5
70
60
A
62
58
53
50
49
46
40
42
41
30
31
30
2626
25
22
20
Istogramma delle frequenze (A)
e poligono di frequenza (B)
relativi ai punteggi della tabella
precedente.
21
16
10
9
6
0
4
12
1212
10
9
11
5
9
13
17
21
25
29
33
verbale
B
10
8
6
4
2
6
0
4
7
verbale
9
11
13
15
17
19
21
23
25
27
29
31
33
35
Ranghi
I ranghi sono dei numeri
che indicano la posizione di
ciascuna osservazione in
rapporto alle altre. Il rango 1
può essere attribuito o al
numero più piccolo
(disposizione crescente) o
al numero più grande
(disposizione decrescente).
Ogni volta è necessario
specificare quale scelta si
fa.
OSSERVAZIONI
RANGO A
RANGO B
4
1
7
18
2
6
19
3
5
20
4
4
22
5
3
50
6
2
120
7
1
In questa tabella, per esempio, il punteggio 4 ha rango a uguale a 1 perché,
ordinando in maniera crescente i punteggi, risulta in prima posizione; rango b
uguale a 7 perché,ordinando in maniera decrescente, risulta in ultima posizione.
7
NEL CASO DI DUE O PIÙ OSSERVAZIONI UGUALI SI PROCEDE
CALCOLANDO LA MEDIA DEI RANGHI INIZIALI, QUINDI
ATTRIBUITI ALLO STESSO PUNTEGGIO.
Conversione in ranghi dei punteggi ordinati
Osser
Osser
equi
equi
rango v. con ranghi
ranghi v con ranghi
ranghi
vale
vale
Osserv.
a
finali
iniziali
finali
due iniziali
tre
nti
nti
valori
valori
4
1
4
1
1
4
1
1
18
2
18
2
2
18
2
2
19
20
22
50
120
3
4
5
6
7
19
19
20
22
50
120
3
4
3,5
3,5
3,5
3,5
5
5
6
6
7
8
7
8
19
19
19
20
22
50
120
3
4
4
4
4
4
5
4
4
6
6
7
7
8
9
88
8
9
NEL CASO DI DUE O PIÙ OSSERVAZIONI UGUALI SI PROCEDE
CALCOLANDO LA MEDIA DEI RANGHI INIZIALI, QUINDI
ATTRIBUITI ALLO STESSO PUNTEGGIO.
Conversione in ranghi dei punteggi ordinati
Osser
Osser
equi
equi
rango v. con ranghi
ranghi v con ranghi
ranghi
vale
vale
Osserv.
a
finali
iniziali
finali
due iniziali
tre
nti
nti
valori
valori
4
1
4
1
1
4
1
1
18
2
18
2
2
18
2
2
19
20
22
50
120
3
4
5
6
7
19
19
20
22
50
120
3
4
3,5
3,5
3,5
3,5
5
5
6
6
7
8
7
8
19
19
19
20
22
50
120
3
4
4
4
4
4
5
4
4
6
6
7
7
8
9
89
99
COME SI PROCEDE CON OSSERVAZIONI UGUALI?
UN PUNTEGGIO CHE APPARE PIÙ VOLTE RICEVE LA MEDIA
DEI RANGHI INIZIALI
Conversione in ranghi dei punteggi ordinati
Osser
Osser
equi
equi
rango v. con ranghi
ranghi v con ranghi
ranghi
vale
vale
Osserv.
a
finali
iniziali
finali
due iniziali
tre
nti
nti
valori
valori
4
1
4
1
1
4
1
1
18
2
18
2
2
18
2
2
19
20
22
50
120
3
4
5
6
7
19
19
20
22
50
120
3
4
3,5
3,5
3,5
3,5
5
5
6
6
7
8
7
8
19
19
19
20
22
50
120
3
4
4
4
4
4
5
4
4
6
6
7
7
8
9
810
9
COME SI PROCEDE CON OSSERVAZIONI UGUALI?
UN PUNTEGGIO CHE APPARE PIÙ VOLTE RICEVE
LA MEDIA DEI RANGHI INIZIALI
Conversione in ranghi dei punteggi ordinati
Osser
Osser
equi
equi
rango v. con ranghi
ranghi v con ranghi
ranghi
vale
vale
Osserv.
a
finali
iniziali
finali
due iniziali
tre
nti
nti
valori
valori
4
1
4
1
1
4
1
1
18
2
18
2
2
18
2
2
19
20
22
50
120
3
4
5
6
7
19
19
20
22
50
120
3
4
3,5
3,5
3,5
3,5
5
5
6
6
7
8
7
8
19
19
19
20
22
50
120
3
4
4
4
4
4
5
4
4
6
6
7
7
8
9
8
9 11
11
Il rango percentile indica la
posizione di un’osservazione
all’interno di un insieme
prescindendo dalla numerosità
del campione (come le
percentuali).
Ranghi percentili
Punto
grezzo
rango
Rango centile
o percentile
2
12
4,17
4
11
12,50
18
10
20,83
19
8
37,50
19
8
37,50
Richiede una formula specifica:
19
8
37,50
( N  (G  0,5))
RC  100 
N
20
6
54,17
22
5
62,50
28
4
70,83
38
3
79,17
50
2
87,50
120
1
95,83
Il percentile 70 è, per esempio, il
valore superiore al 70 % dei casi, e
inferiore al 30% dei casi.
Formula di calcolo
N = Numero delle osservazioni
G = Rango
RC = Rango percentile (o centile)
12
osservazione
rango
ascendente
(quasi)
percentile
rango
percentile
1002
1004
1018
1019
1020
1021
1022
1026
1028
1036
1
2
3
4
5
6
7
8
9
10
10
20
30
40
50
60
70
80
90
100
0,5
10,5
20,5
30,5
40,5
50,5
60,5
70,5
80,5
90,5
13
osservazione
rango
discendente
rango
percentile
1002
1004
1018
1019
1020
1021
1022
1026
1028
1036
10
9
8
7
6
5
4
3
2
1
90,5
80,5
70,5
60,5
50,5
40,5
30,5
20,5
10,5
0,5
14
Distribuzione cumulativa di frequenze e ogiva
Come interpretare i dati usando l’ogiva e i percentili:
Il punteggio 17 o inferiore è ottenuto all’incirca da 50 % dei
soggetti; un punteggio uguale o inferiore a 25 è ottenuto dal 90%
dei soggetti.
Percentili
5
10
25
50
75
90
95
Punteggio di
abilità verbale
11
12
15
17
21
25
28
15
Distribuzione
cumulativa di
frequenze e
ogiva
120
100
80
[Grafico relativo
alla tabella
precedente]
60
40
20
0
16
4
7
9
11 13 15 17 19 21 23 25 27 29 31 33 35
16
verbale
punto
rango
grezzo
ordinato
con N
dispari
con N
pari
2
1
5
2
6
3
9
4
10
5
11
6
15
7
2
1
5
2
6
3
9
4
10
5
11
6
mediana
mediana = 9
mediana = 7,5
17
LA MEDIANA
Mediana (Mdn): in un insieme di dati ordinati, è quel
valore che occupa la posizione centrale nella
distribuzione dei dati stessi.
Divide in due metà( 50% inferiore e 50% superiore) la
distribuzione dei dati:
Mdn=
dove N è il numero di osservazioni
18
Esempio:
• N dispari = 7
{2,5,6,9,10,11,15}
Mdn=
N4= 9 (è nella quarta posizione)
• N pari = 6
{2,5,6,9,10,11}
Mdn=
La posizione 3,5 si colloca tra i valori 6 e 9 e dunque è
necessario calcolare la media aritmetica tra i due valori
6+9=7,5 ; la mediana in questo caso non esiste e si pone
come convenzione pari al valore medio fra le due
posizioni.
19
I QUANTILI
Se dividendo una distribuzione a metà otteniamo la mediana,
dividendola in quattro parti otterremo tre valori corrispondenti
ai quartili. Allo stesso modo, dividendo in tre parti si ottengono
i terzili, in cinque i quintili, in cento i centili, e così via.
Distribuzione
0
50% dei casi
Mediana
Mdn
N
50% dei casi
Divisione in terzili
T1
0
0
Q1
P 25
N
T2
Divisione in quartili
Q2
Divisione in centili
P 50
Q3
N
P 75
0
Equivalenze
Q1 (primo quartile) = 25° percentile
Q2 (secondo quartile) = 50° percentile = Mediana
Q3 (terzo quartile) = 75° percentile
N
20
COME CALCOLARE IL PERCENTILE
Per esempio, il 43° percentile
 n 1
PosP43  
  43
 100 
con n = numero totale dei casi
21
MEDIA, VARIANZA E DEVIAZIONE STANDARD
MEDIA: valore centrale di un insieme di dati, dato dalla somma di tutti i valori
della distribuzione diviso per il numero totale dei casi che la
compongono.
VARIANZA: somma degli scarti dalla media elevati al quadrato e divisi per il
numero totale dei casi.
DEVIAZIONE STANDARD: scarto dalla media, ottenibile tramite la radice
quadrata della varianza.
22
FORMULE
MEDIA
VARIANZA
 xi  M 

N
2
s
2
x
xi 

M2
N
2
oppure,
semplificando
s
2
x
DEVIAZIONE
STANDARD
23
CALCOLO DI MEDIA, VARIANZA E DEVIAZIONE STANDARD
Punteggio
Scarto dalla
media
Quadrato
dello scarto
Quadrato del
punteggio
1 Alessio
2
-2
4
4
2 Bruno
3
-1
1
9
3 Carlo
4
0
0
16
4 Davide
2
-2
4
4
5 Enrico
9
5
25
81
Totale
20
0
34
114
Media
4
0
6,8
22,8
Media
4
Deviazione
Standard
2,61
Varianza
6,8
Soggetto
Media dei quadrati degli scarti
24
VARIANZA
Due modi
Media dei quadrati degli scarti
xi  M 
s x
N
2
34
6,8 =
5
2
media dei quadrati meno quadrato della media.
 xi 
2

M
N
2
s
2
x
114
6,8 =
5
4
2
25
LA STANDARDIZZAZIONE
26
Standardizzazione dei punteggi
I punti grezzi di un test possono essere convertiti in
modo da imporre una media pari a zero e una
deviazione standard uguale a uno con questa
formula:
grezzo  media
punto zeta 
d .s.
27
Trasformazione in punti zeta
soggetto
test K
scarto
dalla
media
Anna
1
-3,4
11,56
1
-1,247
Brigida
2
4
7
8
-2,4
5,76
4
-0,880
-0,4
0,16
16
-0,147
2,6
6,76
49
0,953
3,6
12,96
64
1,320
0
37,2
134
0
media
22
4,4
0
7,44
26,8
0
varianza
7,44
dev stand
2,728
Carlo
Delia
Enrico
somma
quadrato
dello
scarto
quadrato
del
punteggio
punto
zeta (*)
[trovato con (26,8 – (4,4)2]
(*) z= (grezzo - media)/dev. stand.
28
VANTAGGI DEI PUNTI ZETA
Sono confrontabili con punteggi di altri test e
misurazioni
Se hanno una distribuzione normale, si può far
riferimento alle tavole della distribuzione della
curva normale
SVANTAGGI DEI PUNTI ZETA
Hanno la virgola (o punto) decimale
Hanno il segno negativo
29
ESEMPI DI PUNTEGGI STANDARDIZZATI
Punti T
Media = 50
ds = 10
Si ottengono con la formula
T = z ∙10 + 50
Esempio:
Trasformare il punto zeta -0,42 in punto T
T= -0,42 ∙10 + 50 = 45,8 , arrotondato a 46
30
ESEMPI DI PUNTEGGI STANDARDIZZATI
Punti C
Media = 5
ds = 2
Si ottengono con la formula
C = z ∙2 + 5
Esempio:
Trasformare il punto zeta -0,42 in punto C
C = -0,42 ∙2 + 5 = 4,16 arrotondato a 4
31
ESEMPI DI PUNTEGGI STANDARDIZZATI
Punti Q Media = 100
ds = 20 (GATB) oppure
15 (WAIS) oppure
16 (Stanford-Binet)
Per quanto riguarda, ad esempio, il test GATB, si ottengono
con la formula
Q = z ∙20 + 100
Per gli altri due test cambierà ovviamente il valore per cui si
moltiplica z,ovvero il valore della deviazione standard.
Esempio:
Trasformare il punto zeta -0,42 in punto Q
Q = -0,42 ∙20 + 100 = 91,6 arrotondato a 92
32
ESISTONO ALTRE FORME DI PUNTI
STANDARDIZZATI
Punti Stanine (Stanine)
punto z· 2 +5 (9 punti in totale, perché
gli intervalli estremi sono aperti)
Punti Sten (standard Ten)
punto z· 2 +5,5 (10 punti in totale)
33
La conversione in punti T non normalizza la distribuzione.
.
Esempio con dati reali
Punti grezzi di Colpevolezza (da 5 a 22), media= 8,15 ; d.s.= 3,36
160
140
120
100
80
60
40
20
34
0
4
6
5
8
7
10
9
12
11
14
13
16
15
18
17
20
19
22
21
23
Punti di Colpevolezza convertiti in punti T
160
140
120
100
80
60
40
20
0
40,0
48,0
44,0
56,0
52,0
64,0
60,0
72,0
68,0
80,0
76,0
35
88,0
84,0
92,0