Università degli Studi di Palermo
Insegnamento di
“Statistica Medica”
per la Facoltà di Medicina e Chirurgia
a.a. 2011/2012
(3 cfu)
Docente
Dott.ssa Domenica Matranga
Etimologia della parola “Statistica”
‡
‡
Deriva dal vocabolo Italiano STATO
Ghislini (1589): “la Statistica è la descrizione delle
qualità che caratterizzano e degli elementi che
compongono uno Stato
Le due anime della Statistica
Risposta a un’esigenza
conoscitiva
Raccolta, Organizzazione e
diffusione di dati statistici
Constatazione che la realtà
è variabile ma vi sono
risultati che meritano più
fiducia di altri perché si
ripetono con maggiore
regolarità
Studio dell’incertezza come
fattore immanente nella
scienza, nella tecnica,
nelle attività umane
Definizioni
La Statistica è la disciplina che studia i fenomeni collettivi
con metodi quantitativi.
“La statistica è la disciplina che elabora i principi e le
metodologie che presiedono alla rilevazione e alla
raccolta dei dati, alla rappresentazione sintetica e
all’interpretazione dei dati stessi e, laddove ve ne siano
le condizioni, alla generalizzazione delle evidenze
osservate” (Cicchitelli)
E’ una scienza probabilistica. L’analisi statistica dei dati
conduce a risultati che non sono certi ma sono molto
vicini alla realtà, con un’approssimazione che si può
calcolare.
Statistica
Statistica
metodologica
Statistica
economica
Statistica
sociale
Statistica
medica
Obiettivi del corso
Introdurre le basi della metodologia statistica, indirizzando la
conoscenza delle tecniche utilizzate ai problemi che si
incontrano più frequentemente in ambito medico-sanitario
Sarà illustrata la metodologia statistica descrittiva per il
trattamento e l’elaborazione statistica dei dati, per giungere a
svolgere autonomamente analisi statistiche descrittive e saper
interpretare i risultati ottenuti.
Saranno introdotti la teoria della probabilità, il campionamento
statistico e gli aspetti relativi alla statistica inferenziale con
applicazioni all’ambito medico-sanitario.
Di che cosa si occupa la statistica medica?
1. Misurare l’efficacia di nuovi test, procedure e terapie
2. Individuare categorie di pazienti che possono trarre il
maggior giovamento da una terapia, evitando di sottoporre i
pazienti non idonei a potenti farmaci e a pesanti effetti
collaterali
3. Valutazione di efficienza ed efficacia dei servizi sanitari:
Efficacia attesa: Capacità potenziale di un intervento
di modificare in modo favorevole le condizioni di
salute dei pazienti cui è rivolto quando viene applicato
in modo ottimale
Efficacia osservata: Risultati ottenuti dall’applicazione di
routine dell’intervento
Efficienza: Capacità di raggiungere risultati in termine di
salute con il minimo impiego di risorse
4. Fornire gli strumenti necessari per l’uso della
letteratura scientifica nella medicina clinica (Evidencebased medicine)
Statistica
Descrittiva
Inferenziale
La rilevazione dei dati
È completa quando si esa-minano
tutte le unità statistiche che
compongono
la
popolazione
oggetto di studio.
Pregi:
‡Accuratezza delle stime anche
a livelli territoriali molto spinti
‡Ricchezza delle informazioni
raccolte
‡Esaustività
Difetti:
‡Costo elevato
‡Tempi di elaborazione dei dati
molto lunghi
‡Qualità dei dati non elevata
È parziale quando ci si limita a
studiare un sottoinsieme, detto
“campione”
dell’insieme
di
riferimento.
Pregi:
‡Continuità della rilevazione
‡Economicità
‡Indagini più mirate e
approfondite
Difetti:
‡Riferimento territoriale non
spinto
‡Variabilità campionaria
Contenuti del corso
¾ Introduzione: concetti, definizioni. Unità statistiche e collettivi;
¾ Statistica descrittiva:
− scale di misura
− distribuzioni di frequenza
− rappresentazioni grafiche
− valori medi
− misure di variabilità
¾ Statistica inferenziale:
− Probabilità
− Distribuzioni notevoli
− Stima statistica
− Verifica delle ipotesi statistiche
− Cenni sulla relazione tra variabili qualitative
Libri di testo
‡
‡
Biostatistica di M. Pagano, K. Gauvreau, II Ed.
italiana a cura di I.F. Angelillo, M. Pavia, P.
Villari, Ed. IDELSON-GNOCCHI
oppure
Biostatistica di Wayne W. Daniel, Edises
Concetti elementari
ƒ Collettivo statistico o popolazione: un insieme di unità statistiche
sulle quali si rilevano uno o più caratteri.
Es. Popolazione residente in un comune
Tutti i pazienti di un reparto
ƒ Unità statistica: è l’elemento della popolazione
Es. ciascun individuo di una popolazione, ciascun nato, ciascuna
azienda ospedaliera
ƒ Popolazione finita: è costituita da un numero finito di unità
statistiche
ƒ Popolazione infinita: è costituita da un numero illimitato di unità
statistiche (es.numero di pezzi prodotti in una fabbrica a ciclo
continuo, lanci di una moneta in un problema di prove ripetute)
Carattere statistico
ƒCarattere statistico: è la caratteristica con cui si presenta un’unità
nel collettivo di riferimento.
Es. unità statistica= paziente
carattere statistico= età, sesso, colesterolo sierico, tipo di terapia.
In genere, su un determinato collettivo si osservano più caratteri
che possono essere studiati singolarmente o in modo congiunto
(studio delle relazioni)
Modalità di un carattere
Ciascun carattere statistico si articola in “modalità” qualitative e
quantitative, che sono i modi in cui un carattere si presenta nelle
unità del collettivo.
La modalità qualitativa è espressa in termini nominali, categorie,
attributi. La modalità quantitativa è espressa da numeri.
Es.
sesso: maschio, femmina
titolo studio: senza titolo, scuola elementare, scuola media
inferiore,…
Gruppo sanguigno: A, B, 0
Spesa sanitaria
Colesterolo sierico, glicemia, statura, diametro della lesione in mm
CLASSIFICAZIONE DEI CARATTERI STATISTICI
Caratteri qualitativi
o sconnessi
Caratteri semiquantitativi
Caratteri quantitativi
Dicotomici
Ordinali rettilinei
Discreti
Policotomici
Ordinali ciclici
Continui
CARATTERE QUALITATIVO O MUTABILE
Misurare un carattere qualitativo consiste nell’osservare e nel
registrare le modalità che esso presenta nelle unità statistiche.
Per determinare le modalità di un carattere qualitativo occorre
costruire una scala di riferimento, composta da nomi o
espressioni lessicali.
CARATTERE QUALITATIVO O MUTABILE
Sconnesso
Ordinato
Le modalità non hanno nessun
legame, si possono confrontare
soltanto per vedere se sono
uguali o diverse.
Rettilineo: ha una “prima” e
un’”ultima” modalità
(es. Grado della gerarchia
militare, ceto sociale,anno di
corso)
Ciclico: le modalità del
carattere sono frutto di una
convenzione
(es. giorno della settimana)
CARATTERE QUANTITATIVO O VARIABILE
Continuo: è un carattere le cui modalità possono assumere, in
linea di principio, qualsiasi valore contenuto in un intervallo
reale.
Discreto: è un carattere le cui modalità possono essere poste
in corrispondenza con l’insieme dei numeri naturali {1, 2,3,..} o
un suo sottinsieme proprio.
Per i caratteri quantitativi possono prendersi come
modalità delle classi
DIVISIONE IN CLASSI DI UN CARATTERE CONTINUO
n. di classi adeguato al problema
classi disgiunte
no classi vuote
includere tutte le modalità del carattere
intervalli aperti a destra o a sinistra
quale ampiezza delle classi?
DIVISIONE IN CLASSI DI UN CARATTERE CONTINUO
1.
Si individuano il minimo e il massimo dei nostri dati
2.
Si sceglie un adeguato numero di classi (si può usare
la formula di Sturges k=1+3.322*log10 (n), dove n è la
numerosità del data-set)
3.
Si calcola il range= massimo-minimo
4.
Si determina l’ampiezza della classe a=Range/k.
5.
La prima classe avrà estremi [minimo;minimo+a]
Esercizio: Determinare la distribuzione di frequenza in 5
classi di uguale ampiezza e costruire il grafico
inferiore superiore frequenze
0.05
0.2
7
0.2
0.35
2
0.35
0.5
1
0.5
0.65
2
0.65
0.8
2
14
score
0.30
0.45
0.25
0.60
0.20
0.10
0.05
0.70
0.20
0.10
0.05
0.55
0.20
0.80
range=
a=
0.75
0.150
classi
frequenze
≤0.2
7
0.2-|0.35
2
0.35-|0.5
1
0.5-|0.65
2
0.65-|0.80
2
RICAPITOLANDO:
MISURAZIONE DEI CARATTERI STATISTICI
Carattere
Esempi
Qualitativo
sconnesso
sesso, guarigione (SI/NO), causa di morte
Qualitativo
Ordinato rettilineo
Anno di nascita, anno di corso, sintomatologia,
qualità di un’immagine
Qualitativo
Ordinato ciclico
Giorno della settimana, mese dell’anno
Quantitativo
discreto
Numero di figli, numero di carie, numero di aborti,
numero di noduli di una lesione cancerosa
Quantitativo
continuo
Peso, statura, colesterolo, glicemia
Classificazione dei caratteri rispetto al livello di misurazione
1) Nominale o classificatoria
2) ordinale o per ranghi
3) ad intervalli
4) di rapporti
Aumentano
le
proprietà di
misura sulla
scala
Scala nominale
ƒ Scala nominale: quei caratteri qualitativi le cui modalità non
presentano un ordine di successione e senza nessuna relazione
quantitativa.
TIPO DI DIETA
Ipoproteica
Iposodica
Ipolipidica
Ipoglucidica
Ipocalorica
Esiste solo una sola relazione: l’identità
Operazione ammessa il conteggio (es.: numero di
pazienti che guariscono)
Scala ordinale
ƒ Scala ordinale: quei caratteri qualitativi le cui modalità
presentano un ordine di successione ma non una grandezza.
Lettura di un'ecografia da parte di un osservatore
Assolutamente benigno
Benigno
Normale
Maligno
Assolutamente maligno
Classificazione BI-RADS
Ordinale o per ranghi
Non solo uguaglianza o
diversità ma anche...
gradazione tra le classi o
tra individui di classi
differenti
Relazione d’ordine è asimmetrica e transitiva
limite
In una scala ordinale, non è
possibile quantificare le differenze
di intensità tra le osservazioni.
Scala a intervalli
ƒ Scala a intervalli: rappresentata da caratteri quantitativi le cui
modalità sono espresse da numeri e consentono dunque di
misurare la distanza tra esse.
Non hanno uno zero assoluto, naturale e non arbitrario.
QI (quoziente
intelligenza)
A
25
B
50
B-A
25
B è più intelligente di A, ma
non posso fare il rapporto e
dire che B è il doppio
intelligente di A (50:25=2)
Il rapporto tra le distanze su una scala è uguale al
rapporto tra le distanze su un’altra scala (es. Scala Celsius o Fahrenheit)
Scala di rapporti
ƒ Scala di rapporti: rappresentata da caratteri quantitativi le cui
modalità sono metriche, consentendo il calcolo di rapporti tra le
unità rispetto ai valori del carattere
Esiste uno zero assoluto, naturale e non arbitrario
Età
Classi di spesa sanitaria
Meno di 5
Meno di 4 (mila euro)
6-10
4|-10
11-20
10|-25
21-40
41-70
Oltre 70
25|-50
50|-100
100 e oltre
La scala Kelvin è scala di rapporti!
Il rapporto tra le misurazioni su una scala è uguale al
rapporto tra le misurazioni su un’altra scala (es. Scala Kilogrammi e Libbre
Scalogramma di Guttmann
Identità
Ordinamento
Differenze
Rapporti
Nominale
Ordinale
Intervallo
Rapporti
+
+
+
+
+
+
+
+
+
+
Rappresentare le variabili
in un foglio excel
Codice studenSesso Anno di
1M
2F
3F
4F
5M
6F
7F
8F
9M
10 F
11 M
12 F
13 M
14 F
15 M
16 F
17 M
18 M
19 M
20 M
Scala
nominale
nascitAnno di
1973
1974
1978
1976
1975
1972
1970
1975
1970
1976
1970
1971
1970
1974
1972
1973
1977
1972
1970
1970
Scala
ordinale
imma N° Esami
1999
1999
1995
1998
1997
1997
1994
1996
1994
1998
1994
1995
1995
1995
1994
1995
1998
1997
1995
1994
18
20
25
23
27
18
21
21
25
19
22
26
17
19
28
17
17
26
25
18
Voto medio
26.0
25.3
28.1
22.2
25.4
23.6
22.6
29.5
21.3
18.9
28.3
27.0
21.0
22.8
23.4
22.4
24.3
25.2
23.6
22.3
Variabile
discreta
Scala
ordinale
Variabile
continua