Simulazione esame2 (CON SOLUZIONI NEL TESTO)

Statistica medica. A.a. 2004-2005 15 Febbraio 2005
Tempo previsto 60 minuti
Cognome e nome_______________________________________________________________________________
Avete consegnato l'esercitazione di Abilità Informatiche? |_SI_|
|_NO_|
LE SOLUZIONI SONO SCRITTE NELLE ULTIME PAGINE
1.
Uno studio ha misurato la pressione arteriosa sistolica in una popolazione di uomini adulti tra 40 e 65 anni di
età, con i seguenti risultati.
Distribuzione Gaussiana; Media = 122,4 mmHg; Deviazione standard= 14,28 mmHg
a.
Calcolate il coefficiente di variazione nella popolazione: __________________________________________
b.
Indicate il valore atteso della media campionaria dei campioni casuali di 25 osservazioni:
c.
Calcolate l'Errore Standard della media campionaria dei campioni casuali di 25 osservazioni:
d.
Calcolate, scrivendo le formule che utilizzate, la probabilità di estrarre dalla popolazione un campione casuale di
25 soggetti con media campionaria della pressione arteriosa sistolica superiore a 128 mmHg
2.
-
Indicate a quale categoria appartengono le seguenti variabili:
Nominale
Valutazione del dolore secondo una scala a 5 valori (0: dolore
assente; 1: dolore lieve; 2:d. moderato; 3:d.forte ; 4: d. intollerabile)
-
Distanza in Km tra abitazione e luogo di lavoro
-
Pressione arteriosa diastolica in mmHg
-
Comune di residenza
-
Fenotipo corrispondente ad un carattere a trasmissione
mendeliana (es piselli lisci / rugosi)
Ordinale
Numerica
3.
Uno studio su 165 maschi sani ha osservato la seguente distribuzione di valori di ferro nel siero:
Fe (mg/L)
n
%
0,50 <= x < 0,70
2
1,2
0,70 <= x < 0,90
12
7,3
0,90 <= x < 1,10
33
20,0
1,10 <= x < 1,30
68
41,2
1,30 <= x < 1,60
34
20,6
1,50 <= x < 1,70
13
7,9
1,70 <= x < 1,90
3
1,8
165
100,0
Totale
Spazio a disposizione per lo svolgimento di calcoli
a. Stimate il valore medio della concentrazione di Fe nel siero, utilizzando la formula della media per dati raggruppati.
__________________________________________________________________________________________
b. Dato un campione casuale di 3 soggetti, quale sarà la probabilità che sia composto da 3 soggetti con valore di Fe >=
1,30 mg/L?
c. Disegnate un istogramma per rappresentare la distribuzione di frequenza relativa della concentrazione di Fe nel siero.
4. Viene condotto uno studio sulla relazione tra FEV1 (Volume espiratorio nel 1° secondo di espirazione forzata,
un indice di funzionalità delle vie aeree) ed altezza. Lo studio è stato condotto in un campione di 20 studenti
maschi, di età compresa tra 20 e 26 anni. L’altezza media del campione studiato era 1,725 m (Dev.Std. 0,0651 m,
Range 1,62 - 1,83 m ).
La retta di regressione stimata con il metodo dei minimi quadrati è:
FEV1 = 3,07 - 0,0073 x altezza [FEV1 è misurato in litri; Altezza è misurata in metri]
a.
Qual è il valore di FEV1 predetto per uno studente alto 1,68 m? _______________________________
b.
La formula ottenuta può essere applicata ad adulti di età tra 40 e 60 anni?
c.
Spiegate la vostra risposta _____________________________________________________________
d.
Immaginate di predire FEV1 per studenti di altezza diversa. Indicate per quale dei due la previsione avrà
un errore statistico inferiore (intervallo di confidenza al 95% del valore predetto più ristretto).
Altezza 1,72 m
Altezza 1,82 m
e.
Spiegate la vostra risposta _______________________________________________________________
5. Conducete uno studio epidemiologico caso-controllo per valutare l'associazione tra fumo di sigaretta ed
insorgenza di tumore della vescica.
a.
Come definite l’ipotesi nulla? (indicate la/e risposta/e che considerate esatta/e)
Lo studio è descrittivo e quindi non ho interesse nell’ipotesi nulla
Il tumore della vescica ha eziologia multifattoriale
Le due variabili (fumo di sigaretta e insorgenza di tumore della vescica) sono indipendenti
L'associazione tra fumo di tabacco e tumore della vescica è ben documentata.
I risultati dello studio sono riassunti nella seguente tabella (tratta con modifiche da Najem et al, Int J Epid. 1982):
Casi di tumore vescicale
Controlli
Totale
Fumatori ed ex fumatori
50
71
121
Mai fumatori
25
71
96
Totale
75
142
217
b.
Calcolate Odds Ratio, scrivendo le formule
c.
Come interpretate il valore di Odds Ratio che avete ottenuto?.
d.
Calcolate la statistica Chi Quadrato (senza la correzione di Yates), scrivendo la formula
e.
Indicate il numero di gradi di libertà. ____________________________________________________
f.
Quale informazione viene fornita dalla statistica Chi Quadrato?
f. Come interpretate il valore di Chi Quadrato che avete ottenuto?. (Avete fissato l’errore di 1° tipo al 5%. ).
Usate in proposito le tavole allegate
____________________________________________________________________________________________
g. L'errore standard del logaritmo dell'OR è 0,297. Calcolate l'Intervallo di Confidenza al 95% dell'OR
_______________________________________________________________________________________
Distribuzione T
1 coda
Probabilità
gradi libertà ↓
2 code
0,005
0,010
0,025
0,050
0,010
0,020
0,050
0,100
1
63,66
31,82
12,71
6,31
63,66
31,82
12,71
6,31
2
9,22
6,96
4,30
2,92
9,22
6,96
4,30
2,92
3
5,84
4,54
3,18
2,35
5,84
4,54
3,18
2,35
4
4,60
3,75
2,78
2,13
4,60
3,75
2,78
2,13
5
4,03
3,37
2,57
2,02
4,03
3,37
2,57
2,02
6
3,71
3,14
2,45
1,94
3,71
3,14
2,45
1,94
7
3,50
3,00
2,37
1,90
3,50
3,00
2,37
1,90
8
3,36
2,90
2,31
1,86
3,36
2,90
2,31
1,86
9
3,25
2,82
2,26
1,83
3,25
2,82
2,26
1,83
10
3,17
2,76
2,23
1,81
3,17
2,76
2,23
1,81
11
3,11
2,72
2,20
1,80
3,11
2,72
2,20
1,80
12
3,06
2,68
2,18
1,78
3,06
2,68
2,18
1,78
13
3,02
2,65
2,16
1,77
3,02
2,65
2,16
1,77
14
2,98
2,63
2,15
1,76
2,98
2,63
2,15
1,76
15
2,95
2,60
2,13
1,75
2,95
2,60
2,13
1,75
16
2,92
2,58
2,12
1,74
2,92
2,58
2,12
1,74
17
2,90
2,57
2,11
1,73
2,90
2,57
2,11
1,73
18
2,88
2,55
2,10
1,73
2,88
2,55
2,10
1,73
19
2,86
2,54
2,90
1,73
2,86
2,54
2,90
1,73
20
2,85
2,53
2,90
1,73
2,85
2,53
2,90
1,73
per numeri di g.l. superiori a 20 usate la riga corrispondente a 20
Distribuzione Chi quadrato
Probabilità
gradi libertà
0,001
0,01
0,025
0,05
0,1
1
10,83
6,64
5,02
3,84
2,71
2
13,82
9,21
7,38
5,99
4,61
3
16,27
11,35
9,35
7,82
6,25
4
18,47
13,28
11,14
9,49
7,78
5
20,52
15,09
12,83
11,07
9,24
6
22,46
16,81
14,45
12,59
10,65
7
24,32
18,48
16,01
14,07
12,02
8
26,13
20,09
17,54
15,51
13,36
9
27,88
21,67
19,02
16,92
14,68
10
29,59
23,21
20,48
18,31
15,99
11
31,26
24,73
21,92
19,68
17,28
12
32,91
26,22
23,34
21,03
18,55
13
34,53
27,69
24,74
22,36
19,81
14
36,12
29,14
26,12
23,69
21,06
15
37,70
30,58
27,49
25,00
22,31
16
39,25
32,00
28,85
26,30
23,54
17
40,79
33,41
30,19
27,59
24,77
18
42,31
34,81
31,53
28,87
25,99
19
43,82
36,19
32,85
30,14
27,20
20
45,32
37,57
34,17
31,41
28,41
per numeri di g.l. superiori a 20 usate la riga corrispondente a 20
Distribuzione normale standard
1 coda
Probabilità
2 code
0,001
0,01
0,025
0,05
0,1
0,001
0,01
0,02
0,05
0,1
3,09
2,33
1,96
1,65
1,29
3,30
2,58
2,33
1,96
1,65
Corso integrato di scienze quantitative, Modulo di statistica
Corso di laurea in medicina e chirurgia
esame del 15 febbraio 2005
SOLUZIONI
1.
Uno studio ha misurato la pressione arteriosa sistolica in una popolazione di uomini adulti tra 40 e 65 anni di
età, con i seguenti risultati.
Distribuzione Gaussiana; Media = 122,4 mmHg; Deviazione standard= 14,28 mmHg
a.
Calcolate il coefficiente di variazione nella popolazione:
coefficiente di variazione = (DS / media) * 100 = 11,67%
b.
Indicate il valore atteso della media campionaria dei campioni casuali di 25 osservazioni:
Il valore atteso della media campionaria è la media della popolazione
c.
Calcolate l'Errore Standard della media campionaria dei campioni casuali di 25 osservazioni:
errore standard
d.
2,86
Calcolate, scrivendo le formule che utilizzate, la probabilità di estrarre dalla popolazione un campione casuale di
25 soggetti con media campionaria della pressione arteriosa sistolica superiore a 128 mmHg
z= (x - media popolazione) / ES = (128 - 122,4) / 2,86 = 1,96
p(z>1,96)= 0,025
Usare la distribuzione t non è appropriato poichè conosciamo la deviazione standard della popolazione
2.
-
Indicate a quale categoria appartengono le seguenti variabili:
Nominale
Valutazione del dolore secondo una scala a 5 valori (0: dolore
Ordinale
Numerica
X
assente; 1: dolore lieve; 2:d. moderato; 3:d.forte ; 4: d. intollerabile)
-
Distanza in Km tra abitazione e luogo di lavoro
X
-
Pressione arteriosa diastolica in mmHg
X
-
Comune di residenza
-
Fenotipo corrispondente ad un carattere a trasmissione X
mendeliana (es piselli lisci / rugosi)
X
3.
Uno studio su 165 maschi sani ha osservato la seguente distribuzione di valori di ferro nel siero:
Fe (mg/L)
n
%
valore di Fe medio
dell'intervallo
0,50 <= x < 0,70
0,70 <= x < 0,90
0,90 <= x < 1,10
1,10 <= x < 1,30
1,30 <= x < 1,60
1,50 <= x < 1,70
1,70 <= x < 1,90
totale
2
12
33
68
34
13
3
165
1,2
7,3
20,0
41,2
20,6
7,9
1,8
100,0
valore di Fe medio
dell'intervallo * n
0,6
0,8
1
1,2
1,4
1,6
1,8
2 * 0,6 =1,2
12 * 0,8=9,6
33
81,6
47,6
20,8
5,4
199,2
a. Stimate il valore medio della concentrazione di Fe nel siero, utilizzando la formula della media per dati raggruppati.
media per dati raggruppati:
199,2 / 165 =1,207273
b. Dato un campione casuale di 3 soggetti, quale sarà la probabilità che sia composto da 3 soggetti con valore di Fe >=
1,30 mg/L?
p che un soggetto estratto dal gruppo di 165 presenti Fe > 1,3 = (34+13+3) / 165 = 0,303
p che tre soggetti presentino tutti Fe > 1,3 = 0,303 * 0,303 * 0,303 = 0,0278
Il valore di p è stato calcolato in modo semplificato, senza tener conto della variazione nella dimensione del
gruppo in seguito all'estrazione di un soggetto. Se si calcolasse tenendone conto si otterrebbe:
p che tre soggetti presentino tutti Fe > 1,3 = (50/165)*(49/164)*(48/163) = 0,0267
%
c. Disegnate un istogramma per rappresentare la distribuzione di frequenza relativa della concentrazione di Fe nel siero.
45,0
40,0
35,0
30,0
25,0
20,0
15,0
10,0
5,0
0,0
Fe (mg/L)
Si ricorda che Fe è una variabile si scala numerica continua, pertanto l'istogramma deve essere disegnato
con le barre contigue
4. Viene condotto uno studio sulla relazione tra FEV1 (Volume espiratorio nel 1° secondo di espirazione forzata,
un indice di funzionalità delle vie aeree) ed altezza. Lo studio è stato condotto in un campione di 20 studenti
maschi, di età compresa tra 20 e 26 anni. L’altezza media del campione studiato era 1,725 m (Dev.Std. 0,0651 m,
Range 1,62 - 1,83 m ).
La retta di regressione stimata con il metodo dei minimi quadrati è:
FEV1 = 3,07 - 0,0073 x altezza [FEV1 è misurato in litri; Altezza è misurata in metri]
f.
Qual è il valore di FEV1 predetto per uno studente alto 1,68 m? = 3,07 - 0,0073 x 1,68 = 3,06
g.
La formula ottenuta può essere applicata ad adulti di età tra 40 e 60 anni?
NO
h.
Spiegate la vostra risposta
Il campione è composto da maschi, di età compresa tra 20 e 26 anni, se applicassimo i coefficienti ottenuti
ad altri soggetti, dovremmo assumere la validità dello stesso modello ma non abbiamo dati sperimentali a
sostegno di tale assunzione.
i.
Immaginate di predire FEV1 per studenti di altezza diversa. Indicate per quale dei due la previsione avrà
un errore statistico inferiore (intervallo di confidenza al 95% del valore predetto più ristretto).
Altezza 1,72 m
X
Altezza 1,82 m
j.
Spiegate la vostra risposta
L'errore statistico nella predizione è minimo per valori di x prossimi alla media di x e cresce allontanandosi
dalla media (v. Pagano e Gauvreau p.317 ed appunti lezioni)
5. Conducete uno studio epidemiologico caso-controllo per valutare l'associazione tra fumo di sigaretta ed
insorgenza di tumore della vescica.
g.
Come definite l’ipotesi nulla? (indicate la/e risposta/e che considerate esatta/e)
Lo studio è descrittivo e quindi non ho interesse nell’ipotesi nulla
Il tumore della vescica ha eziologia multifattoriale
Le due variabili (fumo di sigaretta e insorgenza di tumore della vescica) sono indipendenti
X
L'associazione tra fumo di tabacco e tumore della vescica è ben documentata.
I risultati dello studio sono riassunti nella seguente tabella (tratta con modifiche da Najem et al, Int J Epid. 1982):
Casi di tumore vescicale
Controlli
Totale
Fumatori ed ex fumatori
50
71
121
Mai fumatori
25
71
96
Totale
75
142
217
h.
Calcolate Odds Ratio, scrivendo le formule
OR = (50 * 71) / (25 * 71) = 2
i.
Come interpretate il valore di Odds Ratio che avete ottenuto?.
Fumatori ed ex fumatori hanno un rischio di 2 volte rispetto ai non fumatori di ammalarsi di tumore vescicale
j.
Calcolate la statistica Chi Quadrato (senza la correzione di Yates), scrivendo la formula
Chi quadro= 5,53. Per la formula si rimanda al capitolo 15 del testo.
k.
Indicate il numero di gradi di libertà. 1
l.
Quale informazione viene fornita dalla statistica Chi Quadrato?
La probabilità dello scostamento osservato in una tabella di contingenza tra le frequenze osservate e quelle
attese, se vale l'ipotesi nulla di indipendenza delle due variabili.
f. Come interpretate il valore di Chi Quadrato che avete ottenuto?. (Avete fissato l’errore di 1° tipo al 5%. ).
Usate in proposito le tavole allegate
0,01 < p <0,025
g. L'errore standard del logaritmo dell'OR è 0,297. Calcolate l'Intervallo di Confidenza al 95% dell'OR
IC(logOR)= logOR +- 1,96 * ES(logOR) = 0,693 +- 1,96*0,297 = da 0,11 a 1,28
IC(OR) = da exp(0,11) a exp(1,28) = da 1,12 a 3,58