Statistica sociale
CdLS Scienze delle professioni sanitarie
- della riabilitazione (SNT-SPEC/2)
- tecniche-diagnostiche (SNT-SPEC/3)
Docente
Prof. Vincenzo Guardabasso
Il corso si propone di fornire conoscenze di base di
statistica sociale, con particolare riferimento alla
raccolta ed alla sintesi riassuntiva di dati ricavati
da indagini mediante questionario. Saranno
richiamati alcuni concetti di statistica, con
particolare riguardo alle statistiche descrittive ed
inferenziali applicabili nella statistica sociale.
Statistica sociale
Studio dei fenomeni sociali:
fenomeni avvertiti dalla società
relativi alla vita della collettività
ad esempio: natalità e mortalità
che influiscono sulle azioni degli individui
ad esempio: comportamenti e opinioni
Valutazione e rappresentazione quantitativa di fenomeni
sociali (in campo sanitario)
Indicatori sociali
Metodo: l’indagine
1
L’indagine
Scopo:
conoscenza (delle caratteristiche) di una popolazione
Oggetto di studio:
unità statistica (l’individuo)
Rilevazione/osservazione di:
caratteri
qualitativi
quantitativi
Fasi dello studio
Pianificazione
ideazione – ricerca bibliografica
scelta e definizione obiettivo
popolazione e campionamento
scelta metodo: intervista o questionario
piano della rilevazione – protocollo dell’indagine
piano di analisi
Conduzione
Preparazione del questionario
Raccolta dei dati
Revisione e sistemazione dei dati
Comunicazione dei risultati
Analisi statistiche
Preparazione di tabelle e grafici
Diffusione e pubblicazione
2
Fasi dello studio - 1
Pianificazione
ideazione – ricerca bibliografica
scelta e definizione dell’obiettivo
popolazione e campionamento
scelta metodo: intervista o questionario
piano della rilevazione – protocollo dell’indagine
piano di analisi
Modalità di rilevazione - 1
Rilevazione totale (censuaria)
su tutte le unità statistiche
CENSIMENTO
Rilevazione parziale (campionaria)
su un campione delle unità statistiche
INCHIESTA (CAMPIONARIA)
SONDAGGIO
• indagine esplorativa
La rilevazione campionaria è preferita per motivi di
costo e di tempo
3
Modalità di rilevazione - 2
Rilevazione diretta
intervistatore
faccia a faccia
telefonica (C.A.T.I.)
autocompilata
Rilevazione indiretta
documenti (fonti amministrative)
atti individuali (atto di nascita, cartella clinica …)
dati aggregati (statistiche correnti)
sopralluogo
osservatore rileva i comportamenti
Campionamento
1. Individuare bene la popolazione
criteri di inclusione
criteri di esclusione
2. Selezionare un sottoinsieme che rappresenti
adeguatamente la popolazione
Numerosità
Metodo di Campionamento
Selezione casuale: “Randomizzazione”
La randomizzazione, quando è possibile, garantisce la validità
statistica delle inferenze (conclusioni) tratte da un’indagine!
4
Modalità di Campionamento
Probabilistico (casuale)
semplice
stratificato
a grappoli (cluster)
sistematico
Non probabilistico (sconsigliabile!)
a scelta “ragionata” (so io a chi chiedere)
a “presentazione” (man mano che arrivano)
a “valanga” (gli amici degli amici)
Attenzione a vizi ed errori di campionamento
Randomizzazione
Dall’inglese random = casuale
un processo di selezione in cui ogni elemento di un
insieme ha uguale probabilità di essere scelto.
Procedura
lista numerata di elementi tra cui scegliere il
campione
estrarre un numero casuale
5
Vizi ed errori casuali
Vizi o distorsioni (in inglese = bias)
sono errori sistematici, prevalentemente in un senso
o direzione, forniscono risultati distorti, non accurati,
quindi non validi
non possono essere misurati
Errori casuali
sono errori dovuti a fattori diversi ed imprevedibili,
agiscono in sensi diversi e con intensità varia,
diminuiscono la precisione ma non l’accuratezza
possono essere misurati con metodi statistici
Dimensione del campione
La possibilità di trarre conclusioni fondate
dipende dal numero di soggetti coinvolti
nello studio, e dalla modalità di selezione
In genere nelle inchieste si vuole conoscere
un risultato entro margini predefiniti di
incertezza (“con una certa precisione”)
La dimensione del campione dipende da
questi margini, non dalla dimensione della
popolazione!
6
Fasi dello studio - 2
Conduzione
Preparazione del questionario
Raccolta dei dati
Revisione e sistemazione dei dati
I questionari
Formulazione
Presentazione e veste grafica
Domande aperte o chiuse
Risposta singola o multipla
Scala di giudizi
Scala continua visuale analogica: VAS
Codifica e caricamento dei dati
Elaborazione automatica (lettura ottica)
7
I questionari
Presentazione e veste grafica
leggibilità
Migliore stato
di salute
immaginabile
Domande
100
chiuse: risposte predefinite
aperte: spazio libero
semiaperte: risposte predefinite + altre libere
Risposta singola o multipla
8 0
7 0
6 0
specificare sempre la risposta voluta
5 0
Scala di giudizi
esempio:
9 0
4 0
insufficiente mediocre
sufficiente
buono
Scala continua visuale analogica: VAS
esempio: da EQ-5D
3 0
2 0
1 0
0
Peggiore stato
di salute
immaginabile
Effetto delle risposte libere …
Risposta libera
a.s.a
agente di polizia
amministratrice
animatrice
architetto
arredatrice
artigiana
artigiano
ausiliaria
autista
avvocato
badante
barista
biologa
Bracciante agricolo
cameriera
casalinga
cassiera
collaboratrice domestica
collaboratrice scolastica
commercialista
commerciante
commessa
consulente
consulente familiare
contadina
cuoca
cuoco
legg. pes. Risposta libera
3
dirigente
1
disoccupata
1
educatrice
2
elettricista
5
estetista
1
farmacista
1
fiorista
1
fisico sanitario
2 Fisioterapista
1
florovivaista
12
geometra
1 guida turistica
6 hostes
2
igienista dentale
1 impiegata
3 impiegato tecnico laboratorio
300
imprenditrice
1
impresa di pulizie
2 infermiera
1
infermiera professionale
2
informat scient
11
informatrice medica
19
informatrice scientifica
2
ingegnere
1
insegnamte
8 insegnante
2
1
legg. pes. Risposta libera
1
libera profess
5
libera professionista
4
magistrato
1
meccanica
4
medico
1
no
1
operaia
1
orafo
1
oss
1
panettiera
1
parrucchiera
1
pasticcera
1
pedagogista
1
portinaio
313
psicologa
1
Ragioniera
3
rappresentante
1
responsabile produzione
20
ricercatrice
4
salumiera
1
segretaria
1
studente
1
studentessa
2
tecnico di lab
1
tecnico di laboratorio
48
tecnico labortorio
legg. pes.
1
4
1
1
8
1
39
1
2
1
7
1
1
1
2
2
2
1
1
1
3
7
7
1
3
1
8
Un esempio di questionario
Problemi ed errori
Errore non campionario
Mancate risposte totali
irreperibilità, rifiuto, impossibilità a rispondere
effetti
• diminuiscono la numerosità
• comportano una distorsione dei risultati
Errori di risposta e Mancate risposte parziali
difetti del questionario
errori del rilevatore o della tecnica usata
errore volontario
errore nel trattamento dei dati
9
Fasi dello studio - 3
Comunicazione dei risultati
Analisi statistiche
Preparazione di tabelle e grafici
Diffusione e pubblicazione
Scopi della statistica
Perché la statistica nella ricerca medica e
sociale:
variabilità biologica
tra individui e/o nel tempo
errori
Scopi
riassumere: statistica descrittiva
sperimentare: statistica inferenziale
Utilità
eseguire studi (di gradimento, di opinione, etc.)
capire (dati, statistiche, diagrammi, risultati)
10
Richiami di statistica
Caratteristiche: le variabili
Indici di posizione (tendenza centrale)
Indici di dispersione
Frequenze e Tabelle di contingenza
Grafici: Box plot
Rapporti statistici
Probabilità e test di ipotesi
I test non parametrici
Informazioni: le Variabili
Quantitative
scala intervallare o di rapporto
C
o
n
t
e
n
u
t
o
continue
i
n
f
o
r
m
a
t
i
v
o
(da misura)
• esempi: temperatura, altezza, peso
discrete
(da conteggi)
• esempi: posti letto, numero di pazienti
Ordinali
per Ranghi: graduatorie
• esempi:
– ordine di arrivo di una gara
– gradimento di un servizio
– scala del coma; indice di Apgar
Categoriche o Nominali
• esempi: colore, razza
dicotomiche se solo due modalità
• Esempi: sesso, morte
11
Frequenze
Conteggio:
contare il numero delle volte in cui si presenta una
modalità o valore di una variabile
risultato: Frequenza assoluta f
è un numero intero
Riferimento del conteggio al totale N
risultato: Frequenza relativa f / N
Proporzione: è un valore decimale
Riferimento a 100
risultato: Frequenza percentuale f / N x 100
è indicata con il segno percentuale %
attenzione: è diversa da variazione percentuale
Somma delle frequenze =
Frequenza cumulativa e percentuale cumulativa
Rappresentazione grafica - mediana
10
9
8
7
6
Giorni
Box Plot:
Mediana,
Quartili,
Valori estremi
(Outliers)
5
4
3
2
1
0
-1
pre-interv.
post-interv.
degenza tot.
12