Università degli Studi di Palermo
Insegnamento di
“Statistica Medica”
per la Facoltà di Medicina e Chirurgia
a.a. 2011/2012
(3 cfu)
Docente
Dott.ssa Filippa Bono
1
Etimologia della parola “Statistica”


Deriva dal vocabolo Italiano STATO
Ghislini (1589): “la Statistica è la descrizione delle
qualità che caratterizzano e degli elementi che
compongono uno Stato
2
Le due anime della Statistica
Risposta a un’esigenza
conoscitiva
Raccolta, Organizzazione e
diffusione di dati statistici
Constatazione che la realtà
è variabile ma vi sono
risultati che meritano più
fiducia di altri perché si
ripetono con maggiore
regolarità
Studio dell’incertezza come
fattore immanente nella
scienza, nella tecnica,
nelle attività umane
3
Definizioni
La Statistica ha come scopo la conoscenza quantitativa
dei fenomeni collettivi.
“La statistica è la disciplina che elabora i principi e le
metodologie che presiedono alla rilevazione e alla
raccolta dei dati, alla rappresentazione sintetica e
all’interpretazione dei dati stessi e, laddove ve ne siano
le condizioni, alla generalizzazione delle evidenze
osservate” (Cicchitelli)
E’ una scienza probabilistica. L’analisi statistica dei dati
conduce a risultati che non sono certi ma sono molto
vicini alla realtà, con un’approssimazione che si può
calcolare.
4
Statistica
Statistica
metodologica
Statistica
economica
Statistica
sociale
Statistica
medica
5
Obiettivi del corso
Introdurre le basi della metodologia statistica, indirizzando la
conoscenza delle tecniche utilizzate ai problemi che si
incontrano più frequentemente in ambito medico-sanitario
Sarà illustrata la metodologia statistica descrittiva per il
trattamento e l’elaborazione statistica dei dati, per giungere a
svolgere autonomamente analisi statistiche descrittive e saper
interpretare i risultati ottenuti.
Saranno introdotti la teoria della probabilità, il campionamento
statistico e gli aspetti relativi alla statistica inferenziale con
applicazioni all’ambito medico-sanitario.
6
Di che cosa si occupa la statistica medica?
1. Misurare l’efficacia di nuovi test, procedure e terapie
2. Individuare categorie di pazienti che possono trarre il
maggior giovamento da una terapia, evitando di sottoporre i
pazienti non idonei a potenti farmaci e a pesanti effetti
collaterali
3. Valutazione di efficienza ed efficacia dei servizi sanitari:
Efficacia attesa: Capacità potenziale di un intervento di
modificare in modo favorevole le condizioni di salute dei
pazienti cui è rivolto quando viene applicato in modo ottimale
Efficacia osservata: Risultati ottenuti dall’applicazione di
routine dell’intervento
Efficienza: Capacità di raggiungere risultati in termini di
salute con il minimo impiego di risorse
4. Fornire gli strumenti necessari per l’uso della
letteratura scientifica nella medicina clinica (Evidencebased medicine)
7
A cosa servono i metodi della
biostatistica
- Prima che un nuovo farmaco possa essere
commercializzato la casa farmaceutica richiede che venga
sottoposta a un clinical trial: uno studio sperimentale
condotto sull’uomo
L’obiettivo è quello di verificare l’efficacia del farmaco
e gli effetti collaterali
- Le decisioni del governo degli Stati Uniti sono in parte
basate sulle previsioni relative alla longevità della
popolazione
-Dove investire le risorse pubbliche per ridurre la mortalità
infantile?
-Quali fattori aumentano in un soggetto la probabilità di
sviluppare malattie coronariche?
8
Libri di testo


Biostatistica di M. Pagano, K. Gauvreau, II Ed.
italiana a cura di I.F. Angelillo, M. Pavia, P.
Villari, Ed. IDELSON-GNOCCHI
oppure
Biostatistica di Wayne W. Daniel, Edises
edizione 2010
9
Statistica descrittiva e inferenza
La statistica descrittiva
fornisce gli strumenti per
sintetizzare ed esplicitare in
forma corretta il modo in
cui il fenomeno si è
manifestato nel collettivo
osservato
Mediante l’inferenza
statistica è possibile
misurare e controllare
l’attendibilità delle
informazioni provenienti da
un campione
estrazione
del campione
10/1
Carattere statistico
Carattere statistico: è la caratteristica con cui si presenta un’unità
nel collettivo di riferimento.
Es. unità statistica=paziente: età, sesso, colesterolo sierico, tipo di
terapia.
In genere, su un determinato collettivo si osservano più caratteri
che possono essere studiati singolarmente o in modo congiunto
(studio delle relazioni)
11
Modalità di un carattere
Ciascun carattere statistico si articola in “modalità” qualitative e
quantitative, che sono i modi in cui un carattere si presenta nelle
unità del collettivo.
La modalità qualitativa è espressa in termini nominali, categorie,
attributi. La modalità quantitativa è espressa da numeri.
Es.
sesso: maschio, femmina
titolo studio: senza titolo, scuola elementare, scuola media
inferiore,…
Gruppo sanguigno: A, B, 0
Spesa sanitaria
Colesterolo sierico, glicemia, statura, diametro della lesione in mm
12
Un esempio di dati osservati
Nome
Età Sesso Titolo di Attività
studio
Peso
(kg)
Punteggio
esercizi
Rossi M.
32
M
laurea
occupato
72
65
Bianchi G.
39
F
laurea
occupato
55
55
Nicoletti C.
46
M
diploma
disoccupato
79
53
Marcelli F.
28
M
diploma
studente
63
78
Petrone A.
51
F
diploma
casalinga
64
21
13
CLASSIFICAZIONE DEI CARATTERI STATISTICI
Caratteri qualitativi
o sconnessi
Caratteri semiquantitativi
Caratteri quantitativi
Dicotomici
Ordinali rettilinei
Discreti
Policotomici
Ordinali ciclici
Continui
14
Rilevazioni:
Sperimentali/osservazionali
Sperimentali
(Medicina, Fisica, Chimica)
1.
Ipotesi di lavoro
2.
Possibilità di controllo
Osservazionali
(Indagini di mercato, sondaggi)
Non si ha la possibilità di controllc
Controllo

Diretto dei Fattori
Sperimentali e dei Fattori
di Stratificazione

Indiretto:
Randomizzazione
Indagine Statistica
15
Indagine statistica
Indagine Totale
Indagine Campionaria
Fasi dell’indagine
definizione degli obiettivi
definizione delle unità e delle variabili da rilevare
scelta del periodo di riferimento
individuazione della popolazione e della lista delle
unità statistiche
definizione del piano di campionamento
raccolta dei dati
scelta della tecnica di rilevazione
formulazione del questionario e pretest
rilevazione sul campo
registrazione dei dati
registrazione su supporto magnetico
16
controllo e correzione
elaborazione e analisi dei dati
La rilevazione dei dati
La raccolta delle informazioni può essere completa oppure parziale.
È completa quando si esa-minano
tutte le unità statistiche che
compongono la popolazione oggetto
di studio.
È parziale quando ci si limita a
studiare un sottoinsieme, detto
“campione”
dell’insieme
di
riferimento.
Pregi:
Accuratezza delle stime anche
a livelli territoriali molto spinti
Ricchezza delle informazioni
raccolte
Esaustività
Pregi:
Continuità della rilevazione
Economicità
Indagini più mirate e approfondite
Difetti:
Costo elevato
Tempi di elaborazione dei dati
molto lunghi
Qualità dei dati non elevata
17/1
Difetti:
Riferimento territoriale non spinto
Variabilità campionaria
CARATTERE QUANTITATIVO O VARIABILE
Continuo: è un carattere le cui modalità possono assumere, in
linea di principio, qualsiasi valore contenuto in un intervallo
reale.
Discreto: è un carattere le cui modalità possono essere poste
in corrispondenza con l’insieme dei numeri naturali {1, 2,3,..} o
un suo sottinsieme proprio.
Per i caratteri quantitativi possono prendersi come
modalità delle classi
18
DIVISIONE IN CLASSI DI UN CARATTERE CONTINUO
1.
Si individuano il minimo e il massimo dei nostri dati
2.
Si sceglie un adeguato numero di classi (si può usare
la formula di Sturges k=1+3.322*log10 (n), dove n è la
numerosità del data-set)
3.
Si calcola il range= massimo-minimo
4.
Si determina l’ampiezza della classe a=Range/k.
5.
La prima classe avrà estremi [minimo;minimo+a]
19
Esercizio: Determinare la distribuzione di frequenza in 5
classi di uguale ampiezza e costruire il grafico
score
0.30
0.45
0.25
0.60
0.20
0.10
0.05
0.70
0.20
0.10
0.05
0.55
0.20
0.80
range=
a=
inferiore superiore frequenze
0.05
0.2
7
0.2
0.35
2
0.35
0.5
1
0.5
0.65
2
0.65
0.8
2
14
classi
frequenze
≤0.2
7
0.2-|0.35
2
0.35-|0.5
1
0.5-|0.65
2
0.65-|0.80
2
0.75
0.150
20
MISURAZIONE DEI CARATTERI STATISTICI
Carattere
Esempi
Qualitativo
sconnesso
sesso, guarigione (SI/NO), causa di morte
Qualitativo
Ordinato rettilineo
Anno di nascita, anno di corso, sintomatologia,
qualità di un’immagine
Qualitativo
Ordinato ciclico
Giorno della settimana, mese dell’anno
Quantitativo
discreto
Numero di figli, numero di carie, numero di aborti,
numero di noduli di una lesione cancerosa
Quantitativo
continuo
Peso, statura, colesterolo, glicemia
21
Classificazione dei caratteri rispetto al livello di misurazione
1) Nominale o classificatoria
2) ordinale o per ranghi
3) ad intervalli
Aumentano
le
proprietà di
misura sulla
scala
4) di rapporti
22
Scala nominale
 Scala nominale: quei caratteri qualitativi le cui modalità non
presentano un ordine di successione e senza nessuna relazione
quantitativa.
TIPO DI DIETA
Ipoproteica
Iposodica
Ipolipidica
Ipoglucidica
Ipocalorica
Esiste solo una sola relazione: l’identità
Operazione ammessa il conteggio (es.: numero di
pazienti che guariscono)
23
Scala ordinale
 Scala ordinale: quei caratteri qualitativi le cui modalità
presentano un ordine di successione ma non una grandezza.
Lettura di un'ecografia da parte di un osservatore
Assolutamente benigno
Benigno
Normale
Maligno
Assolutamente maligno
Classificazione BI-RADS
24
Ordinale o per ranghi
Non solo uguaglianza o
diversità ma anche...
gradazione tra le classi o
tra individui di classi
differenti
Relazione d’ordine è asimmetrica e transitiva
limite
In una scala ordinale, non è
possibile quantificare le differenze
di intensità tra le osservazioni.
25
Scala a intervalli
 Scala a intervalli: rappresentata da caratteri quantitativi le cui
modalità sono espresse da numeri e consentono dunque di
misurare la distanza tra esse.
Non hanno uno zero assoluto, naturale e non arbitrario.
QI (quoziente
intelligenza)
A
25
B
50
B-A
25
B è più intelligente di A, ma
non posso fare il rapporto e
dire che B è il doppio
intelligente di A (50:25=2)
Il rapporto tra le distanze su una scala è uguale al
26
rapporto tra le distanze su un’altra scala (es. Scala Celsius o Fahrenheit)
Scala di rapporti
 Scala di rapporti: rappresentata da caratteri quantitativi le cui
modalità sono metriche, consentendo il calcolo di rapporti tra le
unità rispetto ai valori del carattere
Esiste uno zero assoluto, naturale e non arbitrario
Età
Classi di spesa sanitaria
Meno di 5
Meno di 4 (mila euro)
6-10
4|-10
11-20
10|-25
21-40
41-70
Oltre 70
25|-50
50|-100
100 e oltre
La scala Kelvin è scala di rapporti!
Il rapporto tra le misurazioni su una scala è uguale al
27
rapporto tra le misurazioni su un’altra scala (es. Scala Kilogrammi e Libbre
Scalogramma di Guttmann
Identità
Ordinamento
Differenze
Rapporti
Nominale
Ordinale
Intervallo
Rapporti
+
+
+
+
+
+
+
+
+
+
28
Rappresentare le variabili
in un foglio excel
ID studente Sesso Anno di nascita Anno di immatricolazione Esami completati Voto medio
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Variabile
discreta
Scala
nominale
Scala
ordinale
Scala
ordinale
Variabile
continua
29