I dati: tipologia e modalità di presentazione

I dati:
tipologia e modalità di presentazione
Unità statistica: unità elementare sulla quale si
osservano i caratteri oggetto di studio
Variabile (carattere): caratteristica che viene
rilevata su ogni unità statistica. Può assumere
valori diversi nelle diverse unità (variabile
casuale).
Dati nominali
- i valori sono raggruppabili in categorie o classi
NON ORDINATE
- quantificati con conteggi
- relazione di identità
- caratteri dicotomici: i dati possono assumere
solo due valori
Tabella di frequenza
grafico a torta
grafico a barre
Dati ordinali


modalità logicamente sequenziali (ordine crescente
o decrescente);
non è possibile quantificare le differenze di intensità
tra le osservazioni
- Giudizi: insufficiente, sufficiente, discreto, ottimo,
eccellente
- Valutazioni qualitatitive (es: dolore): assente,
lieve, moderato, grave, gravissimo
- Scale di valutazione: ASA, NYHA, Borg,
Gold, Likert, voti scolastici...
Frequenza cumulata
Istogramma
Dati numerici
Quantità che rappresentano dati misurabili:

dati discreti:



possono assumere solo determinati valori (spesso interi)
che differiscono di una quantità fissa.
non possono esistere valori intermedi
dati continui:


possono assumere qualsiasi valore (ad esempio con
decimali)
il livello di accuratezza della misura è il limite alla continuità
della misura
Se serve un minor livello di dettaglio possono essere
trasformati in dati discreti, ordinali o dicotomici
grafico a linea
Boxplot
max
(in assenza di
valori fuori
limite)
valore più grande tra
le osservazioni che
risulta minore o
uguale a Q3+1,5r
range
interquartile
r= Q3-Q1
(in assenza di
valori fuori
limite)
min
valore più piccolo
tra le osservazioni
che risulta maggiore
o uguale a Q1-1,5r
istogramma
poligono di frequenza
Sintesi dei dati
Tendenza centrale: valore più rappresentativo dei
dati
Variabilità: dispersione dei dati
DATI NOMINALI
Oggetti tra i quali non è
possibile stabilire un ordine o
graduatoria
Indice di tendenza centrale:
MODA = classe più rappresentata
Indice di dispersione:
Frequenze delle classi
DATI ORDINALI
1
1° QUARTILE
2° QUARTILE
(MEDIANA)
RANGE
INTERQUARTILE
2
3° QUARTILE
tra 2 e 3
Indice di tendenza centrale:
MEDIANA
Indice di dispersione:
RANGE INTERQUARTILE
Quanto sono alti gli abitanti di Brescia tra i 18 ed i
65 anni?
Media ± SD:169 ± 10 cm
oppure
Media (SD): 169 (10) cm
dettaglio → sintesi = conoscenza
media: tendenza centrale
La deviazione standard
Indicatore di variabilità
media±sd = 169±10
3 SD
139
149
2 SD
1 SD
159
1 SD
169
169
2 SD
179
3 SD
189
199
Giornate di degenza in TI
media±sd: 6±9 giorni
Quando usare media ± sd
Hanno un significato solo in caso di dati numeri
con distribuzione normale
Giornate di degenza in TI
Mediana (IQR): 2 (1-7)
tendenza centrale
range interquartile
variabilità
media±sd: 6±9 giorni
Mediana (IQR): 2 (1-7)
DATI QUANTITATIVI
Indice di tendenza centrale:
MEDIA
Indice di dispersione:
DEVIAZIONE STANDARD

I dati quantitativi senza distribuzione normale si
trattano come i dati ordinali
–

Anche i dati di cui non si capisce la
distribuzione (poche osservazioni)
Distribuzione normale:
–
media = mediana = moda (media = mediana
anche nelle distribuzioni bimodali!)
–
istogramma