Statistica sociale CdLS Scienze delle professioni sanitarie - della riabilitazione (SNT-SPEC/2) - tecniche-diagnostiche (SNT-SPEC/3) Docente Prof. Vincenzo Guardabasso Il corso si propone di fornire conoscenze di base di statistica sociale, con particolare riferimento alla raccolta ed alla sintesi riassuntiva di dati ricavati da indagini mediante questionario. Saranno richiamati alcuni concetti di statistica, con particolare riguardo alle statistiche descrittive ed inferenziali applicabili nella statistica sociale. Statistica sociale Studio dei fenomeni sociali: fenomeni avvertiti dalla società relativi alla vita della collettività ad esempio: natalità e mortalità che influiscono sulle azioni degli individui ad esempio: comportamenti e opinioni Valutazione e rappresentazione quantitativa di fenomeni sociali (in campo sanitario) Indicatori sociali Metodo: l’indagine 1 L’indagine Scopo: conoscenza (delle caratteristiche) di una popolazione Oggetto di studio: unità statistica (l’individuo) Rilevazione/osservazione di: caratteri qualitativi quantitativi Fasi dello studio Pianificazione ideazione – ricerca bibliografica scelta e definizione obiettivo popolazione e campionamento scelta metodo: intervista o questionario piano della rilevazione – protocollo dell’indagine piano di analisi Conduzione Preparazione del questionario Raccolta dei dati Revisione e sistemazione dei dati Comunicazione dei risultati Analisi statistiche Preparazione di tabelle e grafici Diffusione e pubblicazione 2 Fasi dello studio - 1 Pianificazione ideazione – ricerca bibliografica scelta e definizione dell’obiettivo popolazione e campionamento scelta metodo: intervista o questionario piano della rilevazione – protocollo dell’indagine piano di analisi Modalità di rilevazione - 1 Rilevazione totale (censuaria) su tutte le unità statistiche CENSIMENTO Rilevazione parziale (campionaria) su un campione delle unità statistiche INCHIESTA (CAMPIONARIA) SONDAGGIO • indagine esplorativa La rilevazione campionaria è preferita per motivi di costo e di tempo 3 Modalità di rilevazione - 2 Rilevazione diretta intervistatore faccia a faccia telefonica (C.A.T.I.) autocompilata Rilevazione indiretta documenti (fonti amministrative) atti individuali (atto di nascita, cartella clinica …) dati aggregati (statistiche correnti) sopralluogo osservatore rileva i comportamenti Campionamento 1. Individuare bene la popolazione criteri di inclusione criteri di esclusione 2. Selezionare un sottoinsieme che rappresenti adeguatamente la popolazione Numerosità Metodo di Campionamento Selezione casuale: “Randomizzazione” La randomizzazione, quando è possibile, garantisce la validità statistica delle inferenze (conclusioni) tratte da un’indagine! 4 Modalità di Campionamento Probabilistico (casuale) semplice stratificato a grappoli (cluster) sistematico Non probabilistico (sconsigliabile!) a scelta “ragionata” (so io a chi chiedere) a “presentazione” (man mano che arrivano) a “valanga” (gli amici degli amici) Attenzione a vizi ed errori di campionamento Randomizzazione Dall’inglese random = casuale un processo di selezione in cui ogni elemento di un insieme ha uguale probabilità di essere scelto. Procedura lista numerata di elementi tra cui scegliere il campione estrarre un numero casuale 5 Vizi ed errori casuali Vizi o distorsioni (in inglese = bias) sono errori sistematici, prevalentemente in un senso o direzione, forniscono risultati distorti, non accurati, quindi non validi non possono essere misurati Errori casuali sono errori dovuti a fattori diversi ed imprevedibili, agiscono in sensi diversi e con intensità varia, diminuiscono la precisione ma non l’accuratezza possono essere misurati con metodi statistici Dimensione del campione La possibilità di trarre conclusioni fondate dipende dal numero di soggetti coinvolti nello studio, e dalla modalità di selezione In genere nelle inchieste si vuole conoscere un risultato entro margini predefiniti di incertezza (“con una certa precisione”) La dimensione del campione dipende da questi margini, non dalla dimensione della popolazione! 6 Fasi dello studio - 2 Conduzione Preparazione del questionario Raccolta dei dati Revisione e sistemazione dei dati I questionari Formulazione Presentazione e veste grafica Domande aperte o chiuse Risposta singola o multipla Scala di giudizi Scala continua visuale analogica: VAS Codifica e caricamento dei dati Elaborazione automatica (lettura ottica) 7 I questionari Presentazione e veste grafica leggibilità Migliore stato di salute immaginabile Domande 100 chiuse: risposte predefinite aperte: spazio libero semiaperte: risposte predefinite + altre libere Risposta singola o multipla 8 0 7 0 6 0 specificare sempre la risposta voluta 5 0 Scala di giudizi esempio: 9 0 4 0 insufficiente mediocre sufficiente buono Scala continua visuale analogica: VAS esempio: da EQ-5D 3 0 2 0 1 0 0 Peggiore stato di salute immaginabile Effetto delle risposte libere … Risposta libera a.s.a agente di polizia amministratrice animatrice architetto arredatrice artigiana artigiano ausiliaria autista avvocato badante barista biologa Bracciante agricolo cameriera casalinga cassiera collaboratrice domestica collaboratrice scolastica commercialista commerciante commessa consulente consulente familiare contadina cuoca cuoco legg. pes. Risposta libera 3 dirigente 1 disoccupata 1 educatrice 2 elettricista 5 estetista 1 farmacista 1 fiorista 1 fisico sanitario 2 Fisioterapista 1 florovivaista 12 geometra 1 guida turistica 6 hostes 2 igienista dentale 1 impiegata 3 impiegato tecnico laboratorio 300 imprenditrice 1 impresa di pulizie 2 infermiera 1 infermiera professionale 2 informat scient 11 informatrice medica 19 informatrice scientifica 2 ingegnere 1 insegnamte 8 insegnante 2 1 legg. pes. Risposta libera 1 libera profess 5 libera professionista 4 magistrato 1 meccanica 4 medico 1 no 1 operaia 1 orafo 1 oss 1 panettiera 1 parrucchiera 1 pasticcera 1 pedagogista 1 portinaio 313 psicologa 1 Ragioniera 3 rappresentante 1 responsabile produzione 20 ricercatrice 4 salumiera 1 segretaria 1 studente 1 studentessa 2 tecnico di lab 1 tecnico di laboratorio 48 tecnico labortorio legg. pes. 1 4 1 1 8 1 39 1 2 1 7 1 1 1 2 2 2 1 1 1 3 7 7 1 3 1 8 Un esempio di questionario Problemi ed errori Errore non campionario Mancate risposte totali irreperibilità, rifiuto, impossibilità a rispondere effetti • diminuiscono la numerosità • comportano una distorsione dei risultati Errori di risposta e Mancate risposte parziali difetti del questionario errori del rilevatore o della tecnica usata errore volontario errore nel trattamento dei dati 9 Fasi dello studio - 3 Comunicazione dei risultati Analisi statistiche Preparazione di tabelle e grafici Diffusione e pubblicazione Scopi della statistica Perché la statistica nella ricerca medica e sociale: variabilità biologica tra individui e/o nel tempo errori Scopi riassumere: statistica descrittiva sperimentare: statistica inferenziale Utilità eseguire studi (di gradimento, di opinione, etc.) capire (dati, statistiche, diagrammi, risultati) 10 Richiami di statistica Caratteristiche: le variabili Indici di posizione (tendenza centrale) Indici di dispersione Frequenze e Tabelle di contingenza Grafici: Box plot Rapporti statistici Probabilità e test di ipotesi I test non parametrici Informazioni: le Variabili Quantitative scala intervallare o di rapporto C o n t e n u t o continue i n f o r m a t i v o (da misura) • esempi: temperatura, altezza, peso discrete (da conteggi) • esempi: posti letto, numero di pazienti Ordinali per Ranghi: graduatorie • esempi: – ordine di arrivo di una gara – gradimento di un servizio – scala del coma; indice di Apgar Categoriche o Nominali • esempi: colore, razza dicotomiche se solo due modalità • Esempi: sesso, morte 11 Frequenze Conteggio: contare il numero delle volte in cui si presenta una modalità o valore di una variabile risultato: Frequenza assoluta f è un numero intero Riferimento del conteggio al totale N risultato: Frequenza relativa f / N Proporzione: è un valore decimale Riferimento a 100 risultato: Frequenza percentuale f / N x 100 è indicata con il segno percentuale % attenzione: è diversa da variazione percentuale Somma delle frequenze = Frequenza cumulativa e percentuale cumulativa Rappresentazione grafica - mediana 10 9 8 7 6 Giorni Box Plot: Mediana, Quartili, Valori estremi (Outliers) 5 4 3 2 1 0 -1 pre-interv. post-interv. degenza tot. 12