Statistica medica. A.a. 2004-2005 15 Febbraio 2005 Tempo previsto 60 minuti Cognome e nome_______________________________________________________________________________ Avete consegnato l'esercitazione di Abilità Informatiche? |_SI_| |_NO_| LE SOLUZIONI SONO SCRITTE NELLE ULTIME PAGINE 1. Uno studio ha misurato la pressione arteriosa sistolica in una popolazione di uomini adulti tra 40 e 65 anni di età, con i seguenti risultati. Distribuzione Gaussiana; Media = 122,4 mmHg; Deviazione standard= 14,28 mmHg a. Calcolate il coefficiente di variazione nella popolazione: __________________________________________ b. Indicate il valore atteso della media campionaria dei campioni casuali di 25 osservazioni: c. Calcolate l'Errore Standard della media campionaria dei campioni casuali di 25 osservazioni: d. Calcolate, scrivendo le formule che utilizzate, la probabilità di estrarre dalla popolazione un campione casuale di 25 soggetti con media campionaria della pressione arteriosa sistolica superiore a 128 mmHg 2. - Indicate a quale categoria appartengono le seguenti variabili: Nominale Valutazione del dolore secondo una scala a 5 valori (0: dolore assente; 1: dolore lieve; 2:d. moderato; 3:d.forte ; 4: d. intollerabile) - Distanza in Km tra abitazione e luogo di lavoro - Pressione arteriosa diastolica in mmHg - Comune di residenza - Fenotipo corrispondente ad un carattere a trasmissione mendeliana (es piselli lisci / rugosi) Ordinale Numerica 3. Uno studio su 165 maschi sani ha osservato la seguente distribuzione di valori di ferro nel siero: Fe (mg/L) n % 0,50 <= x < 0,70 2 1,2 0,70 <= x < 0,90 12 7,3 0,90 <= x < 1,10 33 20,0 1,10 <= x < 1,30 68 41,2 1,30 <= x < 1,60 34 20,6 1,50 <= x < 1,70 13 7,9 1,70 <= x < 1,90 3 1,8 165 100,0 Totale Spazio a disposizione per lo svolgimento di calcoli a. Stimate il valore medio della concentrazione di Fe nel siero, utilizzando la formula della media per dati raggruppati. __________________________________________________________________________________________ b. Dato un campione casuale di 3 soggetti, quale sarà la probabilità che sia composto da 3 soggetti con valore di Fe >= 1,30 mg/L? c. Disegnate un istogramma per rappresentare la distribuzione di frequenza relativa della concentrazione di Fe nel siero. 4. Viene condotto uno studio sulla relazione tra FEV1 (Volume espiratorio nel 1° secondo di espirazione forzata, un indice di funzionalità delle vie aeree) ed altezza. Lo studio è stato condotto in un campione di 20 studenti maschi, di età compresa tra 20 e 26 anni. L’altezza media del campione studiato era 1,725 m (Dev.Std. 0,0651 m, Range 1,62 - 1,83 m ). La retta di regressione stimata con il metodo dei minimi quadrati è: FEV1 = 3,07 - 0,0073 x altezza [FEV1 è misurato in litri; Altezza è misurata in metri] a. Qual è il valore di FEV1 predetto per uno studente alto 1,68 m? _______________________________ b. La formula ottenuta può essere applicata ad adulti di età tra 40 e 60 anni? c. Spiegate la vostra risposta _____________________________________________________________ d. Immaginate di predire FEV1 per studenti di altezza diversa. Indicate per quale dei due la previsione avrà un errore statistico inferiore (intervallo di confidenza al 95% del valore predetto più ristretto). Altezza 1,72 m Altezza 1,82 m e. Spiegate la vostra risposta _______________________________________________________________ 5. Conducete uno studio epidemiologico caso-controllo per valutare l'associazione tra fumo di sigaretta ed insorgenza di tumore della vescica. a. Come definite l’ipotesi nulla? (indicate la/e risposta/e che considerate esatta/e) Lo studio è descrittivo e quindi non ho interesse nell’ipotesi nulla Il tumore della vescica ha eziologia multifattoriale Le due variabili (fumo di sigaretta e insorgenza di tumore della vescica) sono indipendenti L'associazione tra fumo di tabacco e tumore della vescica è ben documentata. I risultati dello studio sono riassunti nella seguente tabella (tratta con modifiche da Najem et al, Int J Epid. 1982): Casi di tumore vescicale Controlli Totale Fumatori ed ex fumatori 50 71 121 Mai fumatori 25 71 96 Totale 75 142 217 b. Calcolate Odds Ratio, scrivendo le formule c. Come interpretate il valore di Odds Ratio che avete ottenuto?. d. Calcolate la statistica Chi Quadrato (senza la correzione di Yates), scrivendo la formula e. Indicate il numero di gradi di libertà. ____________________________________________________ f. Quale informazione viene fornita dalla statistica Chi Quadrato? f. Come interpretate il valore di Chi Quadrato che avete ottenuto?. (Avete fissato l’errore di 1° tipo al 5%. ). Usate in proposito le tavole allegate ____________________________________________________________________________________________ g. L'errore standard del logaritmo dell'OR è 0,297. Calcolate l'Intervallo di Confidenza al 95% dell'OR _______________________________________________________________________________________ Distribuzione T 1 coda Probabilità gradi libertà ↓ 2 code 0,005 0,010 0,025 0,050 0,010 0,020 0,050 0,100 1 63,66 31,82 12,71 6,31 63,66 31,82 12,71 6,31 2 9,22 6,96 4,30 2,92 9,22 6,96 4,30 2,92 3 5,84 4,54 3,18 2,35 5,84 4,54 3,18 2,35 4 4,60 3,75 2,78 2,13 4,60 3,75 2,78 2,13 5 4,03 3,37 2,57 2,02 4,03 3,37 2,57 2,02 6 3,71 3,14 2,45 1,94 3,71 3,14 2,45 1,94 7 3,50 3,00 2,37 1,90 3,50 3,00 2,37 1,90 8 3,36 2,90 2,31 1,86 3,36 2,90 2,31 1,86 9 3,25 2,82 2,26 1,83 3,25 2,82 2,26 1,83 10 3,17 2,76 2,23 1,81 3,17 2,76 2,23 1,81 11 3,11 2,72 2,20 1,80 3,11 2,72 2,20 1,80 12 3,06 2,68 2,18 1,78 3,06 2,68 2,18 1,78 13 3,02 2,65 2,16 1,77 3,02 2,65 2,16 1,77 14 2,98 2,63 2,15 1,76 2,98 2,63 2,15 1,76 15 2,95 2,60 2,13 1,75 2,95 2,60 2,13 1,75 16 2,92 2,58 2,12 1,74 2,92 2,58 2,12 1,74 17 2,90 2,57 2,11 1,73 2,90 2,57 2,11 1,73 18 2,88 2,55 2,10 1,73 2,88 2,55 2,10 1,73 19 2,86 2,54 2,90 1,73 2,86 2,54 2,90 1,73 20 2,85 2,53 2,90 1,73 2,85 2,53 2,90 1,73 per numeri di g.l. superiori a 20 usate la riga corrispondente a 20 Distribuzione Chi quadrato Probabilità gradi libertà 0,001 0,01 0,025 0,05 0,1 1 10,83 6,64 5,02 3,84 2,71 2 13,82 9,21 7,38 5,99 4,61 3 16,27 11,35 9,35 7,82 6,25 4 18,47 13,28 11,14 9,49 7,78 5 20,52 15,09 12,83 11,07 9,24 6 22,46 16,81 14,45 12,59 10,65 7 24,32 18,48 16,01 14,07 12,02 8 26,13 20,09 17,54 15,51 13,36 9 27,88 21,67 19,02 16,92 14,68 10 29,59 23,21 20,48 18,31 15,99 11 31,26 24,73 21,92 19,68 17,28 12 32,91 26,22 23,34 21,03 18,55 13 34,53 27,69 24,74 22,36 19,81 14 36,12 29,14 26,12 23,69 21,06 15 37,70 30,58 27,49 25,00 22,31 16 39,25 32,00 28,85 26,30 23,54 17 40,79 33,41 30,19 27,59 24,77 18 42,31 34,81 31,53 28,87 25,99 19 43,82 36,19 32,85 30,14 27,20 20 45,32 37,57 34,17 31,41 28,41 per numeri di g.l. superiori a 20 usate la riga corrispondente a 20 Distribuzione normale standard 1 coda Probabilità 2 code 0,001 0,01 0,025 0,05 0,1 0,001 0,01 0,02 0,05 0,1 3,09 2,33 1,96 1,65 1,29 3,30 2,58 2,33 1,96 1,65 Corso integrato di scienze quantitative, Modulo di statistica Corso di laurea in medicina e chirurgia esame del 15 febbraio 2005 SOLUZIONI 1. Uno studio ha misurato la pressione arteriosa sistolica in una popolazione di uomini adulti tra 40 e 65 anni di età, con i seguenti risultati. Distribuzione Gaussiana; Media = 122,4 mmHg; Deviazione standard= 14,28 mmHg a. Calcolate il coefficiente di variazione nella popolazione: coefficiente di variazione = (DS / media) * 100 = 11,67% b. Indicate il valore atteso della media campionaria dei campioni casuali di 25 osservazioni: Il valore atteso della media campionaria è la media della popolazione c. Calcolate l'Errore Standard della media campionaria dei campioni casuali di 25 osservazioni: errore standard d. 2,86 Calcolate, scrivendo le formule che utilizzate, la probabilità di estrarre dalla popolazione un campione casuale di 25 soggetti con media campionaria della pressione arteriosa sistolica superiore a 128 mmHg z= (x - media popolazione) / ES = (128 - 122,4) / 2,86 = 1,96 p(z>1,96)= 0,025 Usare la distribuzione t non è appropriato poichè conosciamo la deviazione standard della popolazione 2. - Indicate a quale categoria appartengono le seguenti variabili: Nominale Valutazione del dolore secondo una scala a 5 valori (0: dolore Ordinale Numerica X assente; 1: dolore lieve; 2:d. moderato; 3:d.forte ; 4: d. intollerabile) - Distanza in Km tra abitazione e luogo di lavoro X - Pressione arteriosa diastolica in mmHg X - Comune di residenza - Fenotipo corrispondente ad un carattere a trasmissione X mendeliana (es piselli lisci / rugosi) X 3. Uno studio su 165 maschi sani ha osservato la seguente distribuzione di valori di ferro nel siero: Fe (mg/L) n % valore di Fe medio dell'intervallo 0,50 <= x < 0,70 0,70 <= x < 0,90 0,90 <= x < 1,10 1,10 <= x < 1,30 1,30 <= x < 1,60 1,50 <= x < 1,70 1,70 <= x < 1,90 totale 2 12 33 68 34 13 3 165 1,2 7,3 20,0 41,2 20,6 7,9 1,8 100,0 valore di Fe medio dell'intervallo * n 0,6 0,8 1 1,2 1,4 1,6 1,8 2 * 0,6 =1,2 12 * 0,8=9,6 33 81,6 47,6 20,8 5,4 199,2 a. Stimate il valore medio della concentrazione di Fe nel siero, utilizzando la formula della media per dati raggruppati. media per dati raggruppati: 199,2 / 165 =1,207273 b. Dato un campione casuale di 3 soggetti, quale sarà la probabilità che sia composto da 3 soggetti con valore di Fe >= 1,30 mg/L? p che un soggetto estratto dal gruppo di 165 presenti Fe > 1,3 = (34+13+3) / 165 = 0,303 p che tre soggetti presentino tutti Fe > 1,3 = 0,303 * 0,303 * 0,303 = 0,0278 Il valore di p è stato calcolato in modo semplificato, senza tener conto della variazione nella dimensione del gruppo in seguito all'estrazione di un soggetto. Se si calcolasse tenendone conto si otterrebbe: p che tre soggetti presentino tutti Fe > 1,3 = (50/165)*(49/164)*(48/163) = 0,0267 % c. Disegnate un istogramma per rappresentare la distribuzione di frequenza relativa della concentrazione di Fe nel siero. 45,0 40,0 35,0 30,0 25,0 20,0 15,0 10,0 5,0 0,0 Fe (mg/L) Si ricorda che Fe è una variabile si scala numerica continua, pertanto l'istogramma deve essere disegnato con le barre contigue 4. Viene condotto uno studio sulla relazione tra FEV1 (Volume espiratorio nel 1° secondo di espirazione forzata, un indice di funzionalità delle vie aeree) ed altezza. Lo studio è stato condotto in un campione di 20 studenti maschi, di età compresa tra 20 e 26 anni. L’altezza media del campione studiato era 1,725 m (Dev.Std. 0,0651 m, Range 1,62 - 1,83 m ). La retta di regressione stimata con il metodo dei minimi quadrati è: FEV1 = 3,07 - 0,0073 x altezza [FEV1 è misurato in litri; Altezza è misurata in metri] f. Qual è il valore di FEV1 predetto per uno studente alto 1,68 m? = 3,07 - 0,0073 x 1,68 = 3,06 g. La formula ottenuta può essere applicata ad adulti di età tra 40 e 60 anni? NO h. Spiegate la vostra risposta Il campione è composto da maschi, di età compresa tra 20 e 26 anni, se applicassimo i coefficienti ottenuti ad altri soggetti, dovremmo assumere la validità dello stesso modello ma non abbiamo dati sperimentali a sostegno di tale assunzione. i. Immaginate di predire FEV1 per studenti di altezza diversa. Indicate per quale dei due la previsione avrà un errore statistico inferiore (intervallo di confidenza al 95% del valore predetto più ristretto). Altezza 1,72 m X Altezza 1,82 m j. Spiegate la vostra risposta L'errore statistico nella predizione è minimo per valori di x prossimi alla media di x e cresce allontanandosi dalla media (v. Pagano e Gauvreau p.317 ed appunti lezioni) 5. Conducete uno studio epidemiologico caso-controllo per valutare l'associazione tra fumo di sigaretta ed insorgenza di tumore della vescica. g. Come definite l’ipotesi nulla? (indicate la/e risposta/e che considerate esatta/e) Lo studio è descrittivo e quindi non ho interesse nell’ipotesi nulla Il tumore della vescica ha eziologia multifattoriale Le due variabili (fumo di sigaretta e insorgenza di tumore della vescica) sono indipendenti X L'associazione tra fumo di tabacco e tumore della vescica è ben documentata. I risultati dello studio sono riassunti nella seguente tabella (tratta con modifiche da Najem et al, Int J Epid. 1982): Casi di tumore vescicale Controlli Totale Fumatori ed ex fumatori 50 71 121 Mai fumatori 25 71 96 Totale 75 142 217 h. Calcolate Odds Ratio, scrivendo le formule OR = (50 * 71) / (25 * 71) = 2 i. Come interpretate il valore di Odds Ratio che avete ottenuto?. Fumatori ed ex fumatori hanno un rischio di 2 volte rispetto ai non fumatori di ammalarsi di tumore vescicale j. Calcolate la statistica Chi Quadrato (senza la correzione di Yates), scrivendo la formula Chi quadro= 5,53. Per la formula si rimanda al capitolo 15 del testo. k. Indicate il numero di gradi di libertà. 1 l. Quale informazione viene fornita dalla statistica Chi Quadrato? La probabilità dello scostamento osservato in una tabella di contingenza tra le frequenze osservate e quelle attese, se vale l'ipotesi nulla di indipendenza delle due variabili. f. Come interpretate il valore di Chi Quadrato che avete ottenuto?. (Avete fissato l’errore di 1° tipo al 5%. ). Usate in proposito le tavole allegate 0,01 < p <0,025 g. L'errore standard del logaritmo dell'OR è 0,297. Calcolate l'Intervallo di Confidenza al 95% dell'OR IC(logOR)= logOR +- 1,96 * ES(logOR) = 0,693 +- 1,96*0,297 = da 0,11 a 1,28 IC(OR) = da exp(0,11) a exp(1,28) = da 1,12 a 3,58