Diapositiva 1 - Università degli Studi di Palermo

Master in Neuropsicologia Clinica
Elementi di Statistica I
Repetita iuvant
La statistica studia i fenomeni, le loro caratteristiche, se e come
essi variano nel tempo e nello spazio;
in alcuni casi può generalizzare il fenomeno osservato su un “ridotto
gruppo di elementi”
in alcuni casi può fare previsioni
Costante
Caratteristica che non cambia nelle diverse
Osservazioni
Variabile
Manifestazione, misurabile su una scala predefinita,
del fenomeno oggetto di studio o del concetto oggetto
di studio
Unità Statistica
Elemento portatore della/e variabile/i in esame
05 aprile 2008
1/26
Master in Neuropsicologia Clinica
Elementi di Statistica I
Modalità
insieme di stati significativamente distinti tra loro
assumibili della variabile in oggetto (esaustivi non
sovrapposti)
Osservazione
Determinazione numerica, o stato, della variabile
effettivamente rilevata sulle unità statistiche.
Universo (popolazione)
Insieme di unità statistiche in studio cui si vogliono
riferire i risultati dell’analisi
Campione
Sottoinsieme di unità statistiche (dette unità
campionarie) estratte dalla popolazione.
05 aprile 2008
2/26
Master in Neuropsicologia Clinica
Elementi di Statistica I
Misurazione
stabilire e applicare regole di assegnazione di numeri
o etichette a proprietà di oggetti o eventi in modo tale
da poter attribuire alcune delle caratteristiche dei numeri
alle proprietà stesse (scaling)
Classificazione delle variabili
1. Qualitative – le cui modalità sono etichette, categorie…
2. Quantitative – le cui modalità sono espresse da valori
o classi di valori numerici
3. Stevens
05 aprile 2008
3/26
Master in Neuropsicologia Clinica
Elementi di Statistica I
Scala di misura
Nominale
Tipo di
variabile
Ordinale
Qualitativa
Intervalli
Rapporti
Quantitativa
Proprietà
Classificazione Ordinamento
Esiste unità
di misura
Relazione
tra le
distanze/
differenze
Zero
assoluto
Rapporto tra
modalità
Operazioni
=≠
=≠
=≠
(X-Y)/(Z-L)
=≠
(X-Y)/(Z-L)
X/Y
Esempio
Genere
Grado di
Neoplasia
Temperatura Pressione
°C
arteriosa
Direzione
cumulativa
delle proprietà
05 aprile 2008
4/26
Master in Neuropsicologia Clinica
Elementi di Statistica I
Esempio:
Corsa campestre
Numero di maglia (basato su assegnazione casuale)
1
3
2
5
4
Numero di maglia: scala nominale
1≠2≠3≠4≠5
05 aprile 2008
5/26
Master in Neuropsicologia Clinica
Elementi di Statistica I
Ordine di arrivo
primo
II
III
IV
ultimo
3
1
5
4
2
Ordine di arrivo: scala ordinale
3
1
5
4
2
Orario di arrivo
13:30
13:32
13:38
13:41
3
1
5
4
Orario di arrivo: scala intervalli
05 aprile 2008
13:50
2
t
t
2
1
 t5 
 t3 

12
6
2
6/26
Master in Neuropsicologia Clinica
Elementi di Statistica I
Tempo di percorrenza
00:00
00:22
00:20
3
1
00:28 00:31
5
4
00:40
2
Tempo di percorrenza: scala rapporti
t2
40

2
t1 20
05 aprile 2008
7/26
Master in Neuropsicologia Clinica
Elementi di Statistica I
Analisi Univariata
Sintesi statistica di una variabile
qualitativa nominale
1. organizzazione dei dati
a. matrice dei dati
Unità Genere Età Tumore SNC
Neoplasia Anno prima diagnosi …
1
M
34 Meningioma
Grado I
2
M
49 Craniofaringioma Grado II
2003
3
F
52 Medulloblastoma Grado II
1999
…
…
… …
…
…
180
F
64 Tum. pineale
Grado I
2001
05 aprile 2008
2000
8/26
Master in Neuropsicologia Clinica
Elementi di Statistica I
Unità statistica: individuo
Variabile oggetto di studio: tipologia del tumore SNC
Modalità:
Medulloblastoma (A)
Meningioma (B)
Schwannoma (C)
Craniofaringioma (D)
Tumore delle cellule germinali (E)
Tumore della regione pineale (F)
Gruppo di osservazione:
05 aprile 2008
180 unità
9/26
Master in Neuropsicologia Clinica
Elementi di Statistica I
Tabella della distribuzione di
frequenze
Tumore
SNC
A
IIII
B
II
C
IIII
D
IIII I
E
0
F
III
Totale 180
05 aprile 2008
ni
fi
141
9
9
14
0
7
180
0,78
0,05
0,05
0,08
0,00
0,04
1,00
frequenze assolute
frequenze relative:
ni/n
10/26
Master in Neuropsicologia Clinica
Elementi di Statistica I
Sintesi numerica?
Tendenza centrale
Moda = Modalità i tale che ni o fi sia max
…la modalità che viene rilevata più volte…
Tumore
SNC
05 aprile 2008
ni
fi
A
141
0,78
B
9
0,05
C
9
0,05
D
14
0,07
E
0
0,00
F
7
0,04
Totale
180
1,00
11/26
Master in Neuropsicologia Clinica
Elementi di Statistica I
Variabilità:
(“capacità” delle osservazioni di assumere valori diversi)
?
Minima variabilità: tutte le unità sono
caratterizzate dalla stessa modalità
(omogeneità)
Tumore
SNC
05 aprile 2008
ni
fi
A
0
0,00
B
180
1,00
C
0
0,00
D
0
0,00
E
0
0,00
F
0
0,00
Totale
180
1,00
12/26
Master in Neuropsicologia Clinica
Elementi di Statistica I
Variabilità:
?
Massima variabilità: tutte le unità si
distribuiscono ‘equamente’ fra le modalità
Tumore
SNC
05 aprile 2008
ni
fi
A
30
0,17
B
30
0,17
C
30
0,17
D
30
0,17
E
30
0,17
F
30
0,17
Totale
180
1,02
13/26
Master in Neuropsicologia Clinica
Elementi di Statistica I
Indice di eterogeneità di Gini
Tumore
SNC
m
G  1   fi
2
ni
fi
A
0
30
0,00
0,17
B
180
30
1,00
0,17
C
0
30
0,00
0,17
m = numero di modalità
D
0
30
0,00
0,17
min  G   1  1  0
E
0
30
0,00
0,17
F
0
30
0,00
0,17
Totale
180
1,00
1,02
i 1
1
1 m 1
max  G   1   2  1  
m
m
i 1 m
m
05 aprile 2008
14/26
Master in Neuropsicologia Clinica
Elementi di Statistica I
Tumore
SNC
ni
fi
fi 2
A
141
0,78
0,608
B
9
0,05
0,003
C
9
0,05
0,003
D
14
0,07
0,006
E
0
0,00
0,000
F
7
0,04
0,002
Totale
180
1,00
0,622
6
G  1   fi  1  0, 622  0,378
2
i 1
max (G) = (6-1) / 6 = 0,833
05 aprile 2008
15/26
Master in Neuropsicologia Clinica
Elementi di Statistica I
Genere
ni
fi
fi 2
M
148
0,82
0,672
F
32
0,18
0,032
Totale
180
1,00
0,704
2
G  1   fi  1  0, 704  0, 296
2
i 1
05 aprile 2008
16/26
Master in Neuropsicologia Clinica
Elementi di Statistica I
Quale variabile presenta maggiore variabilità?
Tumore: GTum  0,378
Genere: G Gen  0, 296
m
G  f  m   1   fi
2
Confronti?
i 1
Indice di eterogeneità relativa
G
m 
2
G

1   fi 

max  G  m  1  i 1

m
05 aprile 2008
17/26
Master in Neuropsicologia Clinica
Elementi di Statistica I
max (GTum) = (6-1) / 6 = 0,833
max (GGen) = (2-1) / 2 = 0,500
GTum
GTum
0,378


 0, 454
max  GTum  0,833
GGen
GGen
0, 296


 0,592
max  GGen  0,500
05 aprile 2008
18/26
Master in Neuropsicologia Clinica
Elementi di Statistica I
Sintesi statistica di una variabile
qualitativa ordinale
Sintesi numerica?
Tendenza centrale:
oltre alla MODA, è possibile calcolare un indicatore
di tendenza centrale che sfrutta l’informazione
contenuta nell’ordinamento…
Mediana
05 aprile 2008
19/26
Master in Neuropsicologia Clinica
Elementi di Statistica I
Mediana
Quel valore di una distribuzione ordinata che divide la
distribuzione in due parti uguali, tali che il numero di
osservazioni uguale o maggiore della mediana coincide con
il numero di osservazioni uguale o minore della mediana
Esempio 1: 5 unità statistiche – var: grado di neoplasia –
modalità: grado I, grado II, grado III, grado IV
05 aprile 2008
20/26
Master in Neuropsicologia Clinica
Elementi di Statistica I
Mediana
(individuazione)
1. si ordinano le unità statistiche (in senso crescente)
2. si individua l’unità centrale,
ovvero quella che nella sequenza ordinata delle u.s.
ha tante u.s. caratterizzate da modalità uguali o inferiori
alla propria quante da modalità maggiori (o uguali)
alla propria
3. la mediana sarà la modalità che caratterizza l’u.s. centrale
05 aprile 2008
21/26
Master in Neuropsicologia Clinica
Elementi di Statistica I
Esempio 1: 5 unità statistiche – var: grado di neoplasia –
modalità: grado I, grado II, grado III, grado IV
Dati: unità: 1
neopl.: II
2
I
3
III
Distrib. ordinata:
posizione:
modalità:
unità:
4
II
5
III
(1)
I
2
(2)
II
1
(3)
II
4
(4)
III
3
(5)
III
5
La mediana è
Grado II
05 aprile 2008
22/26
Master in Neuropsicologia Clinica
Elementi di Statistica I
In pratica:
• Si ordina la sequenza
• Se n è dispari:
l’unità centrale è quella che occupa la
POSIZIONE (n+1)/2 nella sequenza ordinata
• Se n è pari:
le unità centrali sono due e occupano
le POSIZIONI n/2 e n/2+1 nella sequenza ordinata
• La mediana sarà la modalità che caratterizza
l’unità (o le unità) centrale(/i)
05 aprile 2008
23/26
Master in Neuropsicologia Clinica
Elementi di Statistica I
Esempio 2
Gruppo di 180 soggetti affetti da tumore sui quali è stata
valutato il grado di neoplasia.
Variabile: grado di neoplasia
Modalità:
Grado I
Grado II
Grado III
Grado IV
Scala di misura: Ordinale
u.s.
11 53 61 …
modalità I
I
I …
(posizione) (1) (2) (3) …
05 aprile 2008
… 9 27 80 88 …
… 8
… III III III III …
… IV
…(89)(90)(91)(92) …
98
IV
108
IV
… (178) (179) (180)
24/26
Master in Neuropsicologia Clinica
Elementi di Statistica I
Frequenze assolute cumulate
Frequenze relative cumulate
Esempio 3
Grado I
56 unità
Neoplasia
ni
fi
Ni
Fi
Grado I
56
0,31
56
0,31
Grado II
28
0,16
84
0,47
Grado III
76
0,42
160
0,89
Grado IV
20
0,11
180
1,00
Totale
180
1,00
??
??
Grado II
28 unità
Grado III
76 unità
Grado I
Grado II
Grado III
31% unità
42%
Grado
II e III I, II, III
e IVunità
Grado Grado
I e16%
II I,unità
84 unità160 unità 180 unità
Ni = Ni-1 + ni
Fi = Fi-1 + fi
Grado IV
20 unità
Grado IV
11% unità
II e III I, II, III E IV
Grado Grado
I e II I, Grado
89% unità100% unità
47% unità
05 aprile 2008
25/26
Master in Neuropsicologia Clinica
Elementi di Statistica I
Esempio 3
Neoplasia
ni
fi
Ni
Fi
Grado I
56
0,31
56
0,31
Grado II
28
0,16
84
0,47
Grado III
76
0,42
160
0,89
Grado IV
20
0,11
180
1,00
Totale
180
1,00
n = 180 → pari → due u.s.
(n/2) = (90)
(n/2 + 1) = (91)
Cerco u.s. ordinate (90) e (91) → x(90) = III x(91) = III
Oppure:
Modalità i tale che min(Ni) ≥ 90
Modalità i tale che min(Fi) ≥ 0,50
05 aprile 2008
La mediana è
Grado III
26/26