Università del Piemonte Orientale Corso di Laurea in Biotecnologie

Università del Piemonte Orientale
Corso di Laurea in Biotecnologie
Corso di Statistica Medica
Statistica Descrittiva
Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva
1
I dati costituiscono la ‘materia prima’ su cui lavora lo statistico.
I dati vengono forniti dai soggetti che sono coinvolti nella ricerca.
I dati vengono raccolti, elaborati e sintetizzati al fine di ottenere:
- un messaggio sintetico (statistica descrittiva)
- leggi generali ottenute da un numero limitato di osservazioni
ma valide per tutti i soggetti con caratteristiche analoghe
(statistica inferenziale).
Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva
2
Tipi di dati
- Categorici
Binari
Nominali
Ordinali
- Quantitativi o numerici
Attenzione: Il tipo di dato condiziona la scelta del
metodo statistico!
Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva
3
Dati categorici
Binari presentano due soli valori: presente (codificato di regola come 1)
ed assente (codificato di regola come 0). [P&G, Tab.2.1]
Nominali
Solo classificazione, senza ordinamento
Es sesso, specie, area geografica, scuola, tipo istologico, tipo
di neoplasia, codice di malattia, immunofenotipo di
leucemia…..
Ordinali
Classificazione con ordinamento, ma distanza tra i valori non
misurabile o ignota
Es. Punteggio scolastico, valutazione clinica di gravità di un
sintomo, codice TNM, punteggio APGAR.
Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva
4
Esempio di dati ordinali: Graduazione del performance status proposto dall’Eastern Cooperative Oncology
Group / ECOG.
Grado
0
Descrizione
Paziente fisicamente attivo, in grado di svolgere senza restrizioni la normale attività
preterapia.
1
Paziente limitato nell’attività fisica massima; può essere seguito in ambulatorio e
svolgere un lavoro di entità leggera o di tipo sedentario.
2
Paziente in grado di accudire se stesso, ma incapace di svolgere ogni attività
lavorativa. Resta alzato per più del 50% delle ore di veglia.
3
Paziente in grado di accudire se stesso solo parzialmente e costretto a letto o seduto
per più del 50% delle ore di veglia
4
Paziente inabile, costretto permanentemente a letto o seduto e non più in grado di
accudire a se stesso.
5
Paziente morto
Fonte: Oken MM et al. Toxicity and response criteria of the Eastern Cooperative Oncology Group. Am
J Clin Oncol 5: 649-655; 1982.
Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva
5
Esempio di dati ordinali: Graduazione del performance status secondo Karnofsky
Capace di esplicare attività
100 Normale. Non ha sintomi o segni di malattia
normale e di lavorare. Non è
90 Capace di attività normale. Lievi sintomi o segni di malattia
necessaria alcuna particolare
80 Attività normale con sforzo. Alcuni sintomi o segni di malattia
assistenza.
Incapace di lavorare. In grado
di vivere a casa e di occuparsi
delle proprie necessità
personali. E’ richiesto un certo
70 Può accudire se stesso. Incapace di condurre attività normale o
lavoro attivo.
60 Richiede assistenza occasionalmente, ma è in grado di
provvedere alla maggior parte delle proprie necessità.
grado di assistenza
50 Richiede notevole assistenza e frequenti prestazioni mediche.
Incapace di accudire a se
40 Costretto a letto. Richiede assistenza e cure speciali.
stesso. E’ richiesto il ricovero
30 In condizioni serie. E’indicata l’ospedalizzazione.
ospedaliero. Progressione
20 In condizioni gravi. Sono necessari l’ospedalizzazione ed un
rapida della malattia.
intenso trattamento generale di supporto.
10 In condizioni gravissime. Progressione rapida della malattia.
0 Paziente morto
Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva
6
Dati Quantitativi o Numerici
Continui: possono assumere tutti i valori in un intervallo,
di regola sono prodotti da operazioni di misura (altezza, peso, valori
di laboratorio.
Discreti: quando solo alcuni valori sono possibili,
esempi:
- i valori corrispondenti a numeri reali interi come l’età in anni
compiuti
- il risultato di un conteggio.
In pratica, i dati numerici discreti e quelli continui vengono trattati in modo
analogo
Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva
7
Obiettivo della statistica descrittiva:
Sintetizzare ed organizzare le informazioni contenute in una serie
di dati, al fine di:
o presentazione
o esame preliminare ad analisi più complesse
Requisiti
o Mirare agli aspetti essenziali
o Sintesi
o Facilità di comprensione
Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva
8
Nel linguaggio statistico alla parola DATO viene spesso sostituita con la
parola VARIABILE
I dati di interesse vengono raccolti (misurati) per tutti i soggetti inclusi
nella popolazione o nel campione. Il termine ‘variabile’ sottolinea che il
valore cambia da un soggetto all’altro. I dati che non cambiano di valore
sono denominati ‘costanti’.
Alcune definizioni di ‘variabile’:
- ‘una caratteristica che varia da un’entità biologica ad un’altra’ (J.H.Zar)
- ‘qualunque genere di misura di cui si eseguano rilievi individuali è detta
variabile’ (P.Armitage)
Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva
9
In modo analogo a quanto detto per i tipi di dati parliamo di tipo delle
variabili.
Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva
10
Distribuzione di frequenza
La distribuzione di frequenza può essere calcolata per
- dati / variabili nominali
- dati / variabili ordinali
- dati / variabili numeriche
Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva
11
Tabella con distribuzione di frequenza univariata.
Tipo di dato/variabile: nominale
Distribuzione di frequenza per immunofenotipo dei casi di leucemia
linfoblastica acuta infantile diagnosticati in Piemonte (1979-98).
Immunofenotipo
N
%
Non specificato
35
7.0
T
54
10.8
B
12
2.4
B precursor
397
79.7
498
100
Totale
Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva
12
Tabella con distribuzione di frequenza univariata.
Tipo di dato/variabile: numerica continua
Esempio
Numero di globuli
bianchi (G.B.) alla
diagnosi
G.B. ( / ml)
N (%)
Non noto
5 (1.0)
<=9.999
235 (47.2)
10.000 - <50.000
167 (33.5)
>=50.000
91 (18.3)
Totale
Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva
498 (100)
13
Costruzione di una distribuzione di frequenza: procedure
Variabili categoriche:
1. definire i possibili valori della variabile
2. predisporre l’elenco dei possibili valori
3. contare quante osservazioni per ciascun valore (frequenza)
4. calcolare le corrispondenti proporzioni / percentuali) (frequenza
relativa)
numero _ osservazio ni _ nella _ categoria
Pr oporzione =
Totale
Percentuale = proporzione * 100
Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva
14
1. e 2.
Risultato scolastico Frequenza
Proporzione
%
(frequenza relativa)
Insufficiente
Sufficiente
Buono
Distinto
Ottimo
Totale
n: numero di soggetti in ciascuna categoria della variabile
Proporzione: n / numero totale di soggetti
% = proporzione * 100
Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva
15
3 e 4.
Risultato
Frequenza
scolastico
Proporzione
%
(frequenza relativa)
Insufficiente
4
0.14
14 %
Sufficiente
8
0.28
28 %
Buono
7
0.25
25 %
Distinto
4
0.14
14 %
Ottimo
5
0.19
19 %
Totale
28
1.0
100 %
Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva
16
www.man.deakin.edu.au/rodneyc/xlstats.htm
Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva
17
Lettura di una tabella
Prestare attenzione a:
- Valori mancanti
N (%)
Immunophenotype
Not specified
35 (7.0)
T
54 (10.8)
B
12 (2.4)
B precursor
Total
Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva
397 (79.7)
498 (100)
18
- Intervalli aperti
GLOBULI BIANCHI
G.B. ( / ml)
N (%)
missing
5 (1.0)
<=9999
235 (47.2)
10 000- 49 999
167 (33.5)
>=50 000
91 (18.3)
Total
Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva
498 (100)
19
- Indicazione del totale
N (%)
Immunophenotype
Not specified
35 (7.0)
T
54 (10.8)
B
12 (2.4)
B precursor
Total
Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva
397 (79.7)
498 (100)
20
- Intestazioni (della tabella, delle righe , delle colonne)
Distribuzione di frequenza per immunofenotipo dei casi di leucemia
linfoblastica acuta infantile diagnosticati in Piemonte (1979-98).
GLOBULI BIANCHI
G.B. ( / ml)
N (%)
missing
5 (1.0)
<=9999
235 (47.2)
10 000- 49 999
167 (33.5)
>=50 000
91 (18.3)
Total
Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva
498 (100)
21
La rappresentazione grafica di una distribuzione di frequenza è
un valido aiuto per migliorarne la leggibilità.
Rappresentazione grafica della distribuzione di frequenza di una
variabile nominale
Dato / Variabile: diagnosi di dimissione, tipo nominale.
diagnosi di dimissione
Colelitiasi
Ernia inguinale
Tumore del colon
Ulcera duodenale
Tumore del pancreas
Tumore del retto
Ulcera gastrica
Tumore dello stomaco
Tumore dell’esofago
Stenosi esofagea
Totale
Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva
N
12
9
9
4
4
3
2
2
2
1
48
%
25
19
19
8
8
6
4
4
4
2
100
22
Diagramma a barre,
corrispondente alla distribuzione di frequenza
Attività operatoria
14
12
Numero interventi
10
8
6
4
2
0
Colelitiasi
Ernia inguinale
Tumore del
colon
Ulcera
duodenale
Tumore del
pancreas
Tumore del
retto
Ulcera gastrica Tumore dello
stomaco
Tumore
dell’esofago
Stenosi
esofagea
Diagnosi
Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva
23
Diagramma a torta,
corrispondente alla distribuzione di frequenza
Attività operatoria
1
2
2
2
12
3
Colelitiasi
Ernia inguinale
Tumore del colon
Ulcera duodenale
Tumore del pancreas
4
Tumore del retto
Ulcera gastrica
Tumore dello stomaco
Tumore dell’esofago
Stenosi esofagea
4
9
9
Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva
24
Evitate un numero eccessivo di decimali:
- nelle proporzioni usate 2 decimali
- nelle percentuali usate 1 decimale o l’intero
Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva
25
Distribuzione di frequenza cumulativa
La frequenza cumulativa è somma della frequenza delle osservazioni
con valore della variabile inferiore od uguale al valore considerato.
Può essere calcolata per
- dati / variabili ordinali
- dati / variabili numeriche
Calcolata la frequenza cumulativa si può calcolare la corrispondente
proporzione o percentuale cumulativa.
Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva
26
Risultato
Frequenza Frequenza
scolastico
cumulativa
Ottimo
5
Distinto
4
Buono
7
Sufficiente
8
Insufficiente
4
Totale
28
Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva
Frequenza relativa
cumulativa (in %)
27
Risultato
Frequenza Frequenza
scolastico
cumulativa
Ottimo
5
5
Distinto
4
9
Buono
7
16
Sufficiente
8
24
Insufficiente
4
28
Totale
28
28
Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva
Frequenza relativa
cumulativa (in %)
28
Risultato
Frequenza Frequenza
scolastico
Frequenza relativa
cumulativa
cumulativa (in %)
Ottimo
5
5
19%
Distinto
4
9
33 %
Buono
7
16
58 %
Sufficiente
8
24
86 %
Insufficiente
4
28
100 %
Totale
28
28
100 %
Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva
29
Risultato scolastico
9
8
7
Frequenza (assoluta)
6
5
4
3
2
1
0
Ottimo
Distinto
Buono
Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva
Sufficiente
Insufficiente
30
Risultato scolastico
30
25
frequenza (assoluta)
20
15
10
5
0
Ottimo
Distinto
Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva
Buono
Sufficiente
Insufficiente
31
100%
Risultato scolastico
90%
Frequenza relativa (percentuale)
80%
70%
60%
50%
40%
30%
20%
10%
0%
Ottimo
Distinto
Buono
Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva
Sufficiente
Insufficiente
32
Distribuzione di frequenza di dati (variabili) numerici
Se le variabili sono numeriche (continue o discrete con molti valori)
occorre definire gli intervalli dei valori della variabile (classi di valori)
1. gli intervalli debbono essere definiti in modo che tutte le possibili
osservazioni cadano in uno ed uno solo di essi.
2. è opportuno che gli intervalli siano di uguale ampiezza
Esempio: ETA (variabile indicata con il simbolo x )
ƒƒƒƒƒƒƒƒƒƒƒƒƒƒ
00<= x <10
10<= x <20
20<= x <30
30<= x <40
40<= x <50
50<= x <60
60<= x <70
70<= x <80
80<= x <90
90<= x <100
Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva
33
3.
calcolare le corrispondenti distribuzioni di frequenza e proporzioni
semplici e cumulative
Cumulative Cumulative
ETA
Frequency
Percent
Frequency
Percent
ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ
00<= x <10
0
0.0
0
0.0
10<= x <20
0
0.0
0
0.0
20<= x <30
0
0.0
0
0.0
30<= x <40
2
0.5
2
0.5
40<= x <50
38
8.8
40
9.3
50<= x <60
70
16.3
110
25.6
60<= x <70
212
49.3
322
74.9
70<= x <80
104
24.2
426
99.1
80<= x <90
2
0.5
428
99.5
90<= x <100
2
0.5
430
100.0
Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva
34
I segni per definire un intervallo sono:
=
es x=1
Æ include solo i soggetti con variabile X di valore 1
>=
x>=1 Æ include i soggetti con variabile X di valore 1 (incluso) o
superiore ad 1
>
x>1 Æ include solo i soggetti con variabile X di valore superiore
ad 1
<
<=
Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva
35
Istogrammi : rappresentazione grafica di distribuzioni di frequenza di
variabili numeriche.
Vengono disegnati su un grafico dei rettangoli contigui, uno per
ciascun valore o intervallo (classe) di valori della variabile.
L’area dei rettangoli è proporzionale alla frequenza di osservazioni,
E’ opportuno che gli intervalli siano della stessa ampiezza e quindi
che i rettangoli corrispondenti abbiano tutti base uguale: semplifica
sia la preparazione sia la lettura.
Come disporre i valori
Ascisse: valori della variabile
Ordinate: Frequenza (assoluta o percentuale, semplice o cumulativa,
a scelta).
Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva
36
100,0%
90,0%
80,0%
Frequenza relativa %
70,0%
%
60,0%
50,0%
40,0%
30,0%
20,0%
10,0%
80
<=
et
a<
90
90
<=
et
a<
10
0
70
<=
et
a<
80
60
<=
et
a<
70
50
<=
et
a<
60
40
<=
et
a<
50
30
<=
et
a<
40
20
<=
et
a<
30
10
<=
et
a<
20
00
<=
et
a<
10
0,0%
classe di età
Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva
37
100%
90%
80%
Frequenza cumulativa relativa
70%
%
60%
50%
40%
30%
20%
10%
et
a<
10
0
90
a<
80
90
<=
80
<=
et
a<
et
<=
70
<=
60
50
<=
et
a<
70
et
a<
60
50
a<
et
<=
40
30
<=
et
a<
40
et
a<
30
<=
20
<=
10
00
<=
et
a<
10
et
a<
20
0%
classe di età
Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva
38
Poligono di Frequenza
Si ottiene unendo con una linea i punti mediani della parte superiore dei rettangoli
dell'istogramma
60.0%
50.0%
40.0%
30.0%
20.0%
10.0%
Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva
90
<=
et
a<
10
0
80
<=
et
a<
90
70
<=
et
a<
80
60
<=
et
a<
70
50
<=
et
a<
60
40
<=
et
a<
50
30
<=
et
a<
40
20
<=
et
a<
30
10
<=
et
a<
20
00
<=
et
a<
10
0.0%
39
60
50
casi
popolazione
40
30
20
10
0
35
40
45
50
55
Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva
60
65
70
75
40
100
90
80
casi
70
pop.
60
50
40
30
20
10
0
35
40
45
50
Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva
55
60
65
70
75
41
Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva
42
Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva
43
Rappresentazioni alternative di distribuzioni di frequenza:
o Diagrammi a torta (pie chart, vedi esempio seguente)
o Poligoni di frequenza
o Diagrammi di dispersione (a punti) ad una dimensione
o Istogrammi a barre orizzontali
o Figure con area proporzionale alla frequenza (attenzione, la
lettura può essere poco immediata).
Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva
44
I diagrammi a punti sono adatti solo quando il numero di osservazioni è limitato
n
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Hb
111
107
124
141
131
105
96
125
135
140
151
139
162
163
168
171
166
169
157
165
Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva
45
Il risultato non è particolarmente soddisfacente, soprattutto quando le
osservazioni sono molte ed i punti si sovrappongono !
Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva
46
Diagrammi a torta (pie chart). La frequenza è proporzionale
all’angolo al centro, quindi all’area dello spicchio
Esempio di diagramma a torta o Pie chart
Distribuzione di frequenza del numero di globuli bianchi tra i casi di leucemia linfoblastica acuta (LLA) rilevati dal RTI
Piemonte, 1979-98
missing
<=9999.103/l
10 000- 49 999.103/l
>=50 000.103/l
Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva
47
Statistica descrittiva - metodi per analisi bivariata (2
variabili contemporaneamente).
Analizziamo separatamente i seguenti casi:
o Due variabili nominali
o Una variabile nominale e l’altra ordinale
o Due variabili ordinali
o Una variabile quantitativa (discreta o continua) e l’altra
nominale / ordinale
o Due variabili quantitative (discrete o continue)
Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva
48
Statistica descrittiva - bivariata
Due variabili nominali
Una variabile nominale e l’altra ordinale
Due variabili ordinali
-> Distribuzione di frequenza
Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva
49
Distribuzione di frequenza di 2 variabili
Il procedimento è analogo a quanto descritto per una sola variabile,
complicato solo dalla necessità di classificare ciascun soggetto per
due variabili contemporaneamente.
1. definire i possibili valori di ciascuna delle due variabili
2. scrivere una tabella con le due variabili a definire le righe e le
colonne
3. scrivere i valori delle variabili in ordine crescente
4. contare quante osservazioni per ciascuna combinazione di valori
5. calcolare i totali di riga, colonna e tabella
6. calcolare le corrispondenti proporzioni (eventualmente come
percentuali) riferite a: totale generale, totale di riga, tot. di colonna
Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva
50
Problema: descrivere l’associazione tra arteriopatia ed abitudine al
fumo (due variabili categoriche) in uno studio su 200 pazienti:
1. identifico le variabili ed i valori possibili
Var. A (arteriopatia), nominale, valori possibili = 2 (malato, sano).
Var. B (fumo), nominale, valori possibili = 3 (mai fumatore, ex
fumatore, attuale fumatore).
2. preparo una tabella con le due variabili a definire le righe e le
colonne
Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva
51
Totale
Arteriopatia
Malato
Sano
Mai
Fumo
Ex
Attuale
Totale
Queste tabelle sono anche chiamate:
tabelle di contingenza
tabelle crociate (o crosstabs)
tabelle a doppia entrata
Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva
52
Totale
Arteriopatia
Malato
Sano
Mai
8
43
51
Ex
26
45
71
Attuale
30
48
78
64
136
200
Fumo
Totale
Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva
53
Percentuali sul totale delle osservazioni
Arteriopatia
Malati
Sani
% totale
Totale
Malati
Sani
%
%
F Mai
8
43
4,0
21,5
U Ex
26
45
13,0
22,5
M attuale
30
48
15,0
24,0
O Totale
Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva
200
100,0
54
Istogrammi da tabella con 2 variabili
Percentuali sul totale delle osservazioni
Malati
Sani
30,0
25,0
20,0
%
15,0
10,0
5,0
0,0
Mai
Ex
attuale
Malati
4,0
13,0
15,0
Sani
21,5
22,5
24,0
Fumo
Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva
55
Istogrammi da tabella con 2 variabili
Percentuali sul totale delle osservazioni
25,0
20,0
15,0
%
10,0
Malati
Sani
5,0
Sani
0,0
Malati
Mai
Ex
attuale
Fumo
Mai
Ex
attuale
Malati
4,0
13,0
15,0
Sani
21,5
22,5
24,0
Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva
56
Percentuali sul totale di riga
Arteriopatia
Malati
Sani
%riga
Totale
Malati Sani
%
%
%
F
Mai
8
43
51
15,7
84,3 100,0
U
Ex
26
45
71
36,6
63,4 100,0
M
attuale
30
48
78
38,5
61,5 100,0
O
Totale
Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva
200
57
Istogrammi da tabella con 2 variabili Percentuali di malati per ciascuna categoria di fumo
90,0
80,0
70,0
60,0
50,0
Malati
Sani
%
40,0
30,0
20,0
10,0
0,0
Mai
Ex
attuale
Totale
Malati
15,7
36,6
38,5
32,0
Sani
84,3
63,4
61,5
68,0
Fumo
Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva
58
Percentuali sul totale di colonna
Arteriopatia
Malati
Sani
%colonna
Totale
Malati
Sani
F Mai
8
43
12,5
31,6
U Ex
26
45
40,6
33,1
M Attuale
30
48
46,9
35,3
O Totale
64
136
100,0
100,0
Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva
200
59
Istogrammi da tabella con 2 variabili Percentuali di fumatori tra malati e sani
50,0
45,0
40,0
35,0
30,0
%
Malati
Sani
25,0
20,0
15,0
10,0
5,0
0,0
Mai
Ex
attuale
Malati
12,5
40,6
46,9
Sani
31,6
33,1
35,3
Fumo
Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva
60
Esercizi consigliati, tratti da: M.Pagano & K.Gauvreau. Biostatistica (II edizione
italiana). ed. Idelson Gnocchi, Napoli 2003.
1. Partendo dai dati presentati nella tabella 2.10:
a) Indicare di quale tipo di variabili si tratta.
b) Qual’è la percentuale di nati di peso inferiore a 2 kg?
c) Calcolare la frequenza relativa del numero di neonati per classe di peso alla nascita
d) Disegnare l’istogramma del numero di neonati per classe di peso alla nascita
e) Calcolare la frequenza cumulativa (assoluta e relativa) del numero di neonati per classe di
peso alla nascita
f) Disegnare l’istogramma della frequenza cumulativa relativa del numero di neonati per classe
di peso alla nascita.
g) Accorpare i dati della tabella 2.10 in classi di 1000 g e ripetere gli esercizi da c a f.
2. Svolgere i seguenti esercizi tratti dalle pag.26-27: 1, 2, 3, 4, 5, 6, 7.
3. Svolgere i seguenti esercizi tratti dalle pag.26-27: 8, 16 (nel caso sia richiesto un poligono di
frequenza, disegnate un istogramma).
4. Svolgere i seguenti esercizi tratti dalle pag.26-27: 12, 13, 14 (id.).
Gli esercizi saranno corretti in classe
Corso di laurea in biotecnologie - Statistica Medica – Statistica descrittiva
61