Indicatori di Posizione e di Variabilità - Area

Indicatori di Posizione e di Variabilità
Corso di Laurea Specialistica in SCIENZE DELLE
PROFESSIONI SANITARIE DELLA RIABILITAZIONE
Statistica Medica
Indici Sintetici
Consentono il passaggio da una pluralità di informazioni
ad un’unica misura numerica;
Sintetizzano l’intera distribuzione in un singolo valore,
consentendo così confronti nel tempo, nello spazio o tra
circostanze differenti;
In alcuni casi, consentono di verificare se le conseguenze
di una determinata azione abbiano prodotto il risultato
desiderato, in quale direzione e con quale intensità.
Indici Sintetici di Posizione: la media aritmetica
La Media artimetica, di seguito indicata con µ, è quel valore che,
sostituito a tutte le osservazioni, lascia invariata la loro somma.
Se i dati sono organizzati in forma di serie,
x1 , x2 , ..., xn essa si ottiene sommando tutti i valori
osservati e dividendo per il numero di osservazioni:
Pn
µ=
µ=
i=1 xi
n
19.4+14.0+16.8+...+17.7 305.9
= 20 =15.3 mmHG
20
Esempio: Pressione
Oculare
Osservazione 1
Osservazione 2
Osservazione 3
Osservazione 4
Osservazione 5
Osservazione 6
Osservazione 7
...
Osservazione 19
Osservazione 20
19.4
14.0
16.8
14.5
12.0
12.0
13.7
...
19.7
17.7
Indici Sintetici di Posizione: la media aritmetica
La Media artimetica, di seguito indicata con µ, è quel valore che,
sostituito a tutte le osservazioni, lascia invariata la loro somma.
Se i dati sono organizzati in forma di distribuzione
Esempio: Età
di frequenza, (x1 , n1 ), (x2 , n2 ), ..., (xk , nk ) essa si
Età
Frequenza
ottiene moltiplicando ciascun valore per la
20
21
22
23
24
25
4
3
3
3
3
4
Totale
20
corrispondente frequenza, sommando tutti questi
prodotti e dividendo quindi per la somma delle
frequenze:
Pk
µ=
j=1 xj ×
Pk
j=1 nj
nj
Indici Sintetici di Posizione: la media aritmetica
La Media artimetica, di seguito indicata con µ, è quel valore che,
sostituito a tutte le osservazioni, lascia invariata la loro somma.
Se i dati sono organizzati in forma di distribuzione
Esempio: Età
di frequenza, (x1 , n1 ), (x2 , n2 ), ..., (xk , nk ) essa si
Età
Frequenza
ottiene moltiplicando ciascun valore per la
20
21
22
23
24
25
4
3
3
3
3
4
Totale
20
corrispondente frequenza, sommando tutti questi
prodotti e dividendo quindi per la somma delle
frequenze:
Pk
µ=
µ=
j=1 xj ×
Pk
j=1 nj
(20×4)+(21×3)+...+(25×4)
(4+3+...+4)
=
nj
450
=22.5
20
anni
Indici Sintetici di Posizione: la media aritmetica
Proprietà della Media aritmetica
La media aritmetica è sempre compresa tra il minimo e il
massimo della distribuzione osservata;
La media aritmetica è espressa nella stessa unità di
misura dei dati originali;
La somma algebrica degli scarti di ciascuna osservazione
dalla media aritmetica è nulla;
La media aritmetica è una sintesi di tutti i valori ed è quindi
influenzata da outliers; è cioè un indicatore poco robusto;
La media aritmetica può essere calcolata solo per variabili
quantitative.
Indici Sintetici di Posizione: la mediana
La Mediana, di seguito indicata con Me, è il valore assunto dall’unità
statistica che occupa la posizione centrale della distribuzione ordinata in
modo non decrescente; quel valore cioè che lascia alla sua sinistra il
50% delle osservazioni più piccole e alla sua destra il 50% delle
osservazioni più grandi
Calcolo della mediana
1
Si ordina la distribuzione in modo non decrescente;
2
Si determina la posizione mediana
Se il numero di osservazioni n è dispari allora PosMe = n+1
¯
˘ 2
Se il numero di osservazioni n è pari allora PosMe = n2 , n2 + 1
3
Si osserva il valore che occupa la posizione mediana
N.B. Nel caso in cui n è pari e quindi esistono due posizioni mediane, se si è in presenza di variabili quantitative la mediana è ottenuta come semi-somma dei due valori
corrispondenti; se la variabile è qualitativa ordinale allora si dice che la distribuzione
è caratterizzata da due valori mediani.
Indici Sintetici di Posizione: la mediana
Un esempio: n dispari
Valore
19
22
25
26
27
Posizione
1
2
3
4
5
Indici Sintetici di Posizione: la mediana
Un esempio: n dispari
Valore
19
22
25
26
27
Posizione
1
2
3
4
5
PMe =
n+1
2
=
5+1
2
=3
Indici Sintetici di Posizione: la mediana
Un esempio: n dispari
Valore
19
22
25
26
27
Posizione
1
2
3
4
5
PMe =
n+1
2
Me = 25
=
5+1
2
=3
Indici Sintetici di Posizione: la mediana
Un esempio: n dispari
Valore
19
22
25
26
27
Posizione
1
2
3
4
5
Un esempio: n pari
Valore
19
22
25
26
27
41
Posizione
1
2
3
4
5
6
PMe =
n+1
2
Me = 25
=
5+1
2
=3
Indici Sintetici di Posizione: la mediana
Un esempio: n dispari
Valore
19
22
25
26
27
Posizione
1
2
3
4
5
PMe =
n+1
2
=
5+1
2
=3
Me = 25
Un esempio: n pari
Valore
19
22
25
26
27
41
Posizione
1
2
3
4
5
6
PMe =
n
2
= 3, n2 + 1 = 4
Indici Sintetici di Posizione: la mediana
Un esempio: n dispari
Valore
19
22
25
26
27
Posizione
1
2
3
4
5
PMe =
n+1
2
=
5+1
2
=3
Me = 25
Un esempio: n pari
Valore
19
22
25
26
27
41
Posizione
1
2
3
4
5
6
PMe =
Me =
n
2
= 3, n2 + 1 = 4
25+26
2
= 25.5
Indici Sintetici di Posizione: la mediana
La VAS è una rappresentazione grafica della gravità del dolore che un
paziente crede di avvertire. È costituita da una linea orizzontale di 100
millimetri con barre verticali alle due estremità che rappresentano
l’assenza di dolore (0 mm) ed un dolore insostenibile (100 mm). Il
paziente indica il punto che ritiene identifichi il suo stato algico. La
distanza di questo dal punto di assenza di dolore, misurata in millimetri
corrisponde al punteggio dolorifico
Assenza di dolore
0
Dolore Insostenibile
100
Indici Sintetici di Posizione: la mediana
La VAS è una rappresentazione grafica della gravità del dolore che un
paziente crede di avvertire. È costituita da una linea orizzontale di 100
millimetri con barre verticali alle due estremità che rappresentano
l’assenza di dolore (0 mm) ed un dolore insostenibile (100 mm). Il
paziente indica il punto che ritiene identifichi il suo stato algico. La
distanza di questo dal punto di assenza di dolore, misurata in millimetri
corrisponde al punteggio dolorifico
Assenza di dolore
0
Dolore Insostenibile
100
Indici Sintetici di Posizione: la mediana
La VAS è una rappresentazione grafica della gravità del dolore che un
paziente crede di avvertire. È costituita da una linea orizzontale di 100
millimetri con barre verticali alle due estremità che rappresentano
l’assenza di dolore (0 mm) ed un dolore insostenibile (100 mm). Il
paziente indica il punto che ritiene identifichi il suo stato algico. La
distanza di questo dal punto di assenza di dolore, misurata in millimetri
corrisponde al punteggio dolorifico
Assenza di dolore
0
Dolore Insostenibile
22
100
Indici Sintetici di Posizione: la mediana
Prima
Dopo
Diff.
61
26
56
30
63
68
56
31
10
44
69
50
51
78
50
76
47
52
37
32
29
56
35
28
10
21
37
49
30
14
46
51
34
54
18
34
31
18
29
-3
0
-5
35
58
35
-6
-39
14
55
4
0
44
-4
58
13
21
19
Indici Sintetici di Posizione: la mediana
Prima
Dopo
Diff.
Diff.
Pos.
61
26
56
30
63
68
56
31
10
44
69
50
51
78
50
76
47
52
37
32
29
56
35
28
10
21
37
49
30
14
46
51
34
54
18
34
31
18
29
-3
0
-5
35
58
35
-6
-39
14
55
4
0
44
-4
58
13
21
19
-39
-6
-5
-4
-3
0
0
4
13
14
19
21
29
35
35
44
55
58
58
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
Ordinamento
Indici Sintetici di Posizione: la mediana
Prima
Dopo
Diff.
Diff.
Pos.
61
26
56
30
63
68
56
31
10
44
69
50
51
78
50
76
47
52
37
32
29
56
35
28
10
21
37
49
30
14
46
51
34
54
18
34
31
18
29
-3
0
-5
35
58
35
-6
-39
14
55
4
0
44
-4
58
13
21
19
-39
-6
-5
-4
-3
0
0
4
13
14
19
21
29
35
35
44
55
58
58
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
Ordinamento
n = 19
PMe =
n+1
2
= 10
Indici Sintetici di Posizione: la mediana
Prima
Dopo
Diff.
Diff.
Pos.
61
26
56
30
63
68
56
31
10
44
69
50
51
78
50
76
47
52
37
32
29
56
35
28
10
21
37
49
30
14
46
51
34
54
18
34
31
18
29
-3
0
-5
35
58
35
-6
-39
14
55
4
0
44
-4
58
13
21
19
-39
-6
-5
-4
-3
0
0
4
13
14
19
21
29
35
35
44
55
58
58
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
Ordinamento
n = 19
PMe =
n+1
2
Me = 14
= 10
Indici Sintetici di Posizione: la mediana
Proprietà della Mediana
La mediana è sempre compresa tra il minimo e il massimo
della distribuzione osservata;
La mediana è espressa nella stessa unità di misura dei
dati originali;
La mediana può essere calcolata sia per variabili
quantitative che per variabili qualitative ordinali (Attenzione
però al caso in cui n è pari!)
La mediana non risente della presenza di eventuali outliers
perché si disinteressa di ciò che accade nelle code della
distribuzione dei dati;
Indici Sintetici di Posizione: I quartili
I quartili sono indicatori di posizione che, al pari della mediana, si
calcolano rilevando il valore assunto dalle unità statistiche che
occupano posizioni cruciali nella serie ordinata (in senso non
decrescente) dei dati
Il primo quartile (di seguito indicato con Q1 ) è quel valore che
lascia alla sua sinistra il 25 % delle osservazioni più piccole e alla
sua destra il 75 % delle osservazioni più grandi
Il secondo quartile è quel valore che lascia alla sua sinistra il 50 %
delle osservazioni più piccole e alla sua destra il 50 % delle
osservazioni più grandi. Esso quindi coincide con la Mediana
Il terzo quartile (di seguito indicato con Q3 è quel valore che lascia
alla sua sinistra il 75 % delle osservazioni più piccole e alla sua
destra il 25 % delle osservazioni più grandi
Indici Sintetici di Variabilità
La variabilità di un fenomeno è la sua attitudine ad assumere
differenti modalità.
Un indice di variabilità è una misura di tale attitudine, e dovrebbe
possedere le seguenti caratteristiche:
1
2
3
Deve essere non negativo
Deve essere nullo se e solo se tutte le unità presentano la
stessa modalità del carattere;
Deve aumentare all’aumentare della diversità tra le unità.
La variabilità può essere calcolata rispetto ad un centro (misure di
dispersione) o valutando le differenze tra tutte le possibili coppie di
unità osservate (misure di diseguaglianza)
Indici Sintetici di Variabilità: Varianza
La Varianza (di seguito indicata con σ 2 ) è una delle misure di
dispersione più utilizzate in statistica. Utilizza la Media aritmetica come
valore di riferimento e si basa sulle distanze di ciascuna osservazione
dal centro assunto come riferimento.
X
µ
Indici Sintetici di Variabilità: Varianza
La Varianza (di seguito indicata con σ 2 ) è una delle misure di
dispersione più utilizzate in statistica. Utilizza la Media aritmetica come
valore di riferimento e si basa sulle distanze di ciascuna osservazione
dal centro assunto come riferimento.
X
µ
X
µ
Indici Sintetici di Variabilità: Varianza
La Varianza (di seguito indicata con σ 2 ) è una delle misure di
dispersione più utilizzate in statistica. Utilizza la Media aritmetica come
valore di riferimento e si basa sulle distanze di ciascuna osservazione
dal centro assunto come riferimento.
Razionale della Varianza
n
X
i=1
(xi − µ)
Indici Sintetici di Variabilità: Varianza
La Varianza (di seguito indicata con σ 2 ) è una delle misure di
dispersione più utilizzate in statistica. Utilizza la Media aritmetica come
valore di riferimento e si basa sulle distanze di ciascuna osservazione
dal centro assunto come riferimento.
Razionale della Varianza
n
X
i=1
(xi − µ) Il risultato è sempre uguale a 0
Indici Sintetici di Variabilità: Varianza
La Varianza (di seguito indicata con σ 2 ) è una delle misure di
dispersione più utilizzate in statistica. Utilizza la Media aritmetica come
valore di riferimento e si basa sulle distanze di ciascuna osservazione
dal centro assunto come riferimento.
Razionale della Varianza
n
X
(xi − µ) Il risultato è sempre uguale a 0
i=1
n
X
i=1
(xi − µ)2
Indici Sintetici di Variabilità: Varianza
La Varianza (di seguito indicata con σ 2 ) è una delle misure di
dispersione più utilizzate in statistica. Utilizza la Media aritmetica come
valore di riferimento e si basa sulle distanze di ciascuna osservazione
dal centro assunto come riferimento.
Razionale della Varianza
n
X
(xi − µ) Il risultato è sempre uguale a 0
i=1
n
X
i=1
(xi − µ)2 Dipende dal numero di osservazioni
Indici Sintetici di Variabilità: Varianza
La Varianza (di seguito indicata con σ 2 ) è una delle misure di
dispersione più utilizzate in statistica. Utilizza la Media aritmetica come
valore di riferimento e si basa sulle distanze di ciascuna osservazione
dal centro assunto come riferimento.
Razionale della Varianza
n
X
(xi − µ) Il risultato è sempre uguale a 0
i=1
n
X
(xi − µ)2 Dipende dal numero di osservazioni
i=1
Pn
i=1 (xi
n
− µ)2
= σ 2 Media di scarti al quadrato
Indici Sintetici di Variabilità: Varianza
Prima
Dopo
61
26
56
30
63
68
56
31
10
44
69
50
51
78
50
76
47
52
37
32
29
56
35
28
10
21
37
49
30
14
46
51
34
54
18
34
31
18
Indici Sintetici di Variabilità: Varianza
Prima
Dopo
61
26
56
30
63
68
56
31
10
44
69
50
51
78
50
76
47
52
37
32
29
56
35
28
10
21
37
49
30
14
46
51
34
54
18
34
31
18
µprima =
61 + 26 + ... + 37
= 50.3
19
µdopo =
32 + 29 + ... + 56
= 33.0
19
Indici Sintetici di Variabilità: Varianza
Prima
Dopo
61
26
56
30
63
68
56
31
10
44
69
50
51
78
50
76
47
52
37
32
29
56
35
28
10
21
37
49
30
14
46
51
34
54
18
34
31
18
µprima =
61 + 26 + ... + 37
= 50.3
19
µdopo =
32 + 29 + ... + 56
= 33.0
19
2
σprima
=
(61 − 50.3)2 + (26 − 50.3)2 + ... + (37 − 50.3)2
= 298
19
2
σdopo
=
(31 − 33)2 + (29 − 33)2 + ... + (56 − 33)2
= 173
19
Indici Sintetici di Variabilità: Varianza
Prima
Dopo
61
26
56
30
63
68
56
31
10
44
69
50
51
78
50
76
47
52
37
32
29
56
35
28
10
21
37
49
30
14
46
51
34
54
18
34
31
18
µprima =
61 + 26 + ... + 37
= 50.3
19
µdopo =
32 + 29 + ... + 56
= 33.0
19
2
σprima
=
(61 − 50.3)2 + (26 − 50.3)2 + ... + (37 − 50.3)2
= 298
19
2
σdopo
=
(31 − 33)2 + (29 − 33)2 + ... + (56 − 33)2
= 173
19
Conclusioni
Prima del trattamento, il grado di dolore percepito dai pazienti risulta in media maggiore (il
trattamento ha cioè prodotto benefici nel collettivo esaminato). Si è inoltre determinata
una riduzione della dispersione che è passata da 298 a 173; ciò indica che a seguito del
trattamento, i valori di dolore risultano concentrati in misura maggiore attorno al punteggio
medio. Vi è in altre parole un effetto stabilizzante. Cosa si sarebbe potuto concludere se
invece la dispersione dei dati fosse aumentata a seguito del trattamento???
Indici Sintetici di Variabilità: Varianza
Quando i dati sono espressi sotto forma di distribuzione è necessario
tener conto delle frequenze con cui ciascun valore è stato osservato.
Ricordando che la Varianza è una media di scarti al quadrato allora...
Dati in forma di serie
Pn
i=1 xi
µ=
n
σ2 =
Pn
i=1 (xi
n
− µ)2
Indici Sintetici di Variabilità: Varianza
Quando i dati sono espressi sotto forma di distribuzione è necessario
tener conto delle frequenze con cui ciascun valore è stato osservato.
Ricordando che la Varianza è una media di scarti al quadrato allora...
Dati in forma di serie
Pn
i=1 xi
µ=
n
σ2 =
Pn
i=1 (xi
n
− µ)2
Indici Sintetici di Variabilità: Varianza
Quando i dati sono espressi sotto forma di distribuzione è necessario
tener conto delle frequenze con cui ciascun valore è stato osservato.
Ricordando che la Varianza è una media di scarti al quadrato allora...
Dati in forma di serie
Pn
i=1 xi
µ=
n
σ2 =
Pn
i=1 (xi
n
− µ)2
Dati in forma di distribuzione
Pk
j=1 xj × nj
µ = Pk
j=1 nj
Indici Sintetici di Variabilità: Varianza
Quando i dati sono espressi sotto forma di distribuzione è necessario
tener conto delle frequenze con cui ciascun valore è stato osservato.
Ricordando che la Varianza è una media di scarti al quadrato allora...
Dati in forma di serie
Pn
i=1 xi
µ=
n
σ2 =
Pn
i=1 (xi
n
− µ)2
Dati in forma di distribuzione
Pk
j=1 xj × nj
µ = Pk
j=1 nj
Indici Sintetici di Variabilità: Varianza
Quando i dati sono espressi sotto forma di distribuzione è necessario
tener conto delle frequenze con cui ciascun valore è stato osservato.
Ricordando che la Varianza è una media di scarti al quadrato allora...
Dati in forma di serie
Pn
i=1 xi
µ=
n
σ2 =
Pn
i=1 (xi
n
Dati in forma di distribuzione
Pk
j=1 xj × nj
µ = Pk
j=1 nj
− µ)2
Pk
σ2 =
− µ)2 × nj
Pk
j=1 nj
j=1 (xj
Indici Sintetici di Variabilità: Varianza
Quando i dati sono espressi sotto forma di distribuzione è necessario
tener conto delle frequenze con cui ciascun valore è stato osservato.
Ricordando che la Varianza è una media di scarti al quadrato allora...
Dati in forma di serie
Pn
i=1 xi
µ=
n
σ2 =
Pn
i=1 (xi
n
Dati in forma di distribuzione
Pk
j=1 xj × nj
µ = Pk
j=1 nj
− µ)2
Pk
σ2 =
− µ)2 × nj
Pk
j=1 nj
j=1 (xj
Indici Sintetici di Variabilità: Varianza
Distribuzione di frequenza dell’età al primo parto per un collettivo di 40
donne italiane.
Età
Frequenza
26
27
28
29
30
5
3
7
11
14
Totale
40
σ2 =
µ=
(26 × 5) + (27 × 3) + ... + (30 × 14)
= 28.6 anni
40
(26 − 28.6)2 × 5 + (27 − 28.6)2 × 3 + ... + (30 − 28.6)2 × 14
= 1.83 anni2
40
Indici Sintetici di Variabilità: Varianza
Proprietà della Varianza
La varianza non può assumere valori negativi;
E’ nulla se e solo se tutte le osservazioni sono uguali tra di
loro (e quindi la media coincide con esse);
Attribuisce lo stesso peso ad osservazioni distanti dalla
media in una direzione piuttosto che nell’altra;
E’ espressa in una unità di misura che è il quadrato di
quella dei dati originali.
Indici Sintetici di Variabilità: Scarto quadratico medio
Al fine di riportare la misura di variabilità all’unità di misura originale si
estrae la radice quadrata della Varianza ottenendo un indice noto come
Scarto quadratico medio (abbreviato con s.q.m) o Deviazione standard
e di seguito indicato con σ
√
σ=
rP
σ2 =
n
i=1 (xi
− µ)2
n
Lo s.q.m possiede le stesse caratteristiche della varianza ed ha in più il
vantaggio di misurare la variabilità di un fenomeno utilizzando la stessa
lingua dei dati
Esercizio
Distribuzione di frequenza del tempo (in secondi) impiegato per il
completamento di un test di lettura in un colletivo di 20 soggetti
dislessici prima e dopo lo svolgimento di una terapia logopedica.
Durata
Prima
Dopo
60
70
80
90
6
4
4
6
14
3
3
0
Totale
20
20
Utilizzando gli opportuni indici di posizione e di variabilità confrontare le
due distribuzioni e commentare i risultati ottenuti.