I dati: tipologia e modalità di presentazione Unità statistica: unità elementare sulla quale si osservano i caratteri oggetto di studio Variabile (carattere): caratteristica che viene rilevata su ogni unità statistica. Può assumere valori diversi nelle diverse unità (variabile casuale). Dati nominali - i valori sono raggruppabili in categorie o classi NON ORDINATE - quantificati con conteggi - relazione di identità - caratteri dicotomici: i dati possono assumere solo due valori Tabella di frequenza grafico a torta grafico a barre Dati ordinali modalità logicamente sequenziali (ordine crescente o decrescente); non è possibile quantificare le differenze di intensità tra le osservazioni - Giudizi: insufficiente, sufficiente, discreto, ottimo, eccellente - Valutazioni qualitatitive (es: dolore): assente, lieve, moderato, grave, gravissimo - Scale di valutazione: ASA, NYHA, Borg, Gold, Likert, voti scolastici... Frequenza cumulata Istogramma Dati numerici Quantità che rappresentano dati misurabili: dati discreti: possono assumere solo determinati valori (spesso interi) che differiscono di una quantità fissa. non possono esistere valori intermedi dati continui: possono assumere qualsiasi valore (ad esempio con decimali) il livello di accuratezza della misura è il limite alla continuità della misura Se serve un minor livello di dettaglio possono essere trasformati in dati discreti, ordinali o dicotomici grafico a linea Boxplot max (in assenza di valori fuori limite) valore più grande tra le osservazioni che risulta minore o uguale a Q3+1,5r range interquartile r= Q3-Q1 (in assenza di valori fuori limite) min valore più piccolo tra le osservazioni che risulta maggiore o uguale a Q1-1,5r istogramma poligono di frequenza Sintesi dei dati Tendenza centrale: valore più rappresentativo dei dati Variabilità: dispersione dei dati DATI NOMINALI Oggetti tra i quali non è possibile stabilire un ordine o graduatoria Indice di tendenza centrale: MODA = classe più rappresentata Indice di dispersione: Frequenze delle classi DATI ORDINALI 1 1° QUARTILE 2° QUARTILE (MEDIANA) RANGE INTERQUARTILE 2 3° QUARTILE tra 2 e 3 Indice di tendenza centrale: MEDIANA Indice di dispersione: RANGE INTERQUARTILE Quanto sono alti gli abitanti di Brescia tra i 18 ed i 65 anni? Media ± SD:169 ± 10 cm oppure Media (SD): 169 (10) cm dettaglio → sintesi = conoscenza media: tendenza centrale La deviazione standard Indicatore di variabilità media±sd = 169±10 3 SD 139 149 2 SD 1 SD 159 1 SD 169 169 2 SD 179 3 SD 189 199 Giornate di degenza in TI media±sd: 6±9 giorni Quando usare media ± sd Hanno un significato solo in caso di dati numeri con distribuzione normale Giornate di degenza in TI Mediana (IQR): 2 (1-7) tendenza centrale range interquartile variabilità media±sd: 6±9 giorni Mediana (IQR): 2 (1-7) DATI QUANTITATIVI Indice di tendenza centrale: MEDIA Indice di dispersione: DEVIAZIONE STANDARD I dati quantitativi senza distribuzione normale si trattano come i dati ordinali – Anche i dati di cui non si capisce la distribuzione (poche osservazioni) Distribuzione normale: – media = mediana = moda (media = mediana anche nelle distribuzioni bimodali!) – istogramma