UNIVERSITÀ di ROMA TOR VERGATA Corso di Laurea Magistrale in Scienze della Nutrizione Umana Corso di Statistica Medica, anno 2015-16 P.Baldi Lista di esercizi 8 Esercizio 1 La precisione della regolazione di una macchina che produce componenti elettronici deve essere 3mm e viene regolarmente verificata. a1) Vengono fatte n misurazioni e indichiamone con X̄ e S 2 la media e la varianza campionaria rispettivamente e indichiamo con µ il vero valore (incognito) della regolazione. Qual è la regione i rigetto dell’ipotesi H0 : µ = 3 contro l’alternativa µ 6= 3 ? a2) Si è ottenuto X̄ = 3.1 e S 2 = 0.04 con n = 16 misurazioni e supponiamo inoltre che le misurazioni seguano una legge gaussiana. L’ipotesi può essere respinta al livello 5% ? a3) Perché nel punto precedente era necessario supporre che le misurazioni fossero gaussiane ? b1) Supponiamo invece di sapere che le n misurazioni X1 , . . . , Xn seguano un legge gaussiana e abbiano una varianza σ 2 nota. Quale sarebbe una regione di rigetto dell’ipotesi H0 : µ = 3 contro l’alternativa µ 6= 3 ? b2) Si è ottenuto X̄ = 3.1 e σ 2 = 0.04 con n = 16 misurazioni e supponiamo inoltre che le misurazioni seguano una legge gaussiana. L’ipotesi può essere respinta al livello 5% ? Esercizio 2 In un gruppo di pazienti viene sperimentato un farmaco a base di cortisone. Tra le misurazioni cliniche viene anche osservata la differenza tra il valore del colesterolo prima e dopo il trattamento. a1) In un gruppo di n pazienti si osserva una media X̄ per la differenza tra il valore del colesterolo prima e il valore del colesterolo dopo con uno scarto quadratico pari a S. Qual è la regione critica di livello α del test di Student per l’ipotesi che il valore del colesterolo non è cambiato ? a2) Su un gruppo di 81 pazienti si è osservato un valore X̄ = 2 con S = 10. Si può respingere al livello 5% l’ipotesi che il valore del colesterolo non è cambiato ? b) In un gruppo di n pazienti si osserva una media X̄ per la differenza tra il valore del colesterolo prima e il valore del colesterolo dopo con uno scarto quadratico pari a S. Qual è la regione critica di livello α dell’ipotesi che il valore del colesterolo non è cresciuto ? Con i valori in a2), questa ipotesi può essere respinta al livello 5% ? Esercizio 3 La consistenza del gruppo A in una popolazione è del 47%. Dalla popolazione viene estratto un campione di numerosità n. a) Qual è la probabilità che in un campione di numerosità n = 100 ci siano più (>) di 50 individui di tipo A ? 1 b) Qual è la probabilità che in un campione di numerosità n = 400 ci siano più (>) di 200 individui di tipo A ? c) Quanto grande deve essere scelto n perché la probabilità di avere, in un campione di numerosità n = 2k, più di k individui di tipo A sia inferiore all’1% ? (per questo punto si potrà trascurare la correzione di continuità.) Esercizio 4 In un campione di 1600 famiglie di 3 figli si sono osservate le seguenti numerosità per quanto riguarda il numero di figlie femmine: 0 224 1 629 2 572 3 175 a) Qual è la proporzione di femmine ? b) Il test del χ 2 permette di respingere, al livello 5%, l’ipotesi che le nascite siano indipendenti e che ogni evento produce un maschio o una femmina con probabilità 21 ? 2 Soluzioni Esercizio 1. a1) La regione di rigetto del test di Student al livello α è (1) {|T | ≥ t1−α/2 } dove T è la statistica di Student T = X̄ − µ0 √ n. S Occorrerà però supporre che la numerosità n delle osservazioni sia abbastanza grande oppure che le osservazioni seguano una legge gaussiana. a2) Con i dati forniti si trova 1 − α2 = 0.975 e X̄ − µ0 √ 3.1 − 3 √ n= 16 = 2 . S .2 Confrontando questo valore con il quantile t.975 (15) = 2.13, vediamo che la condizione (1) non è soddisfatta e l’ipotesi non può essere respinta è respinta al livello 5%. a3) Come osservato in a1) il test di Student si può applicare solo se la numerosità delle osservazioni è abbastanza grande oppure se si può supporre che esse sono gaussiane. Qui le osservazioni sono solo 16 e quindi occorre poter supporre la gaussianità. b1) Se si conosce la varianza σ 2 delle osservazioni, la regione critica è (2) {|Z| ≥ φ1−α/2 } dove Z è la statistica Z= X̄ − µ0 √ n. σ b2) Con i dati forniti si trova sempre 1 − α 2 = 0.975 e 3.1 − 3 √ X̄ − µ0 √ n= 16 = 2 . σ 0.2 Ora però dobbiamo confrontare questo valore con il quantile φ.975 = 1.96. Dunque la condizione (2) è soddisfatta e l’ipotesi è respinta al livello 5%. Esercizio 2. a1) Supporre che il valore del colesterolo non è cambiato significa supporre che la media delle osservazioni (cioè della differenza tra prima e dopo) è uguale a 0. La regione critica è quindi (3) {|T | ≥ t1−α/2 } 3 dove T è la statistica di Student (4) T = a2) Si ha T = X̄ √ n. S 2 √ 9 81 = = 1.8 10 5 Poiché t.975 (80) = 1.99, l’ipotesi non viene respinta. b) La regione critica ora è (5) {T ≥ t1−α } dove T è sempre la statistica di Student (4). Ovviamente T = 1.8, come in a2), ma adesso questo valore deve essere confrontato con il quantile t.95 (80) = 1.66 e l’ipotesi è respinta a questo livello. Esercizio 3. a) Se indichiamo con Sn il numero d’individui A nel campione, allora usando la formula dell’approssimazione normale, abbiamo P(S100 50 + 1 − 100 · 0.47 > 50) = 1 − P(S100 ≤ 50) ' 1 − 8 = √2 10 0.47 · 0.53 = 1 − 8(0.70) |{z} = 1 − 0.76 = 0.24 tavole b) Ripetendo il ragionamento precedente P(S400 200 + 1 − 400 · .47 > 200) = 1 − P(S400 ≤ 200) ' 1 − 8 = √2 20 .47 · .53 = 1 − 8(1.25) |{z} = 1 − 0.89 = 0.11 tavole c) Abbiamo, senza usare la correzione di contitnuità, k − 2k · 0.47 P(S2k > k) = 1 − P(S2k ≤ k) ' 1 − 8 √ √ 2k 0.47 · 0.53 Perché questa quantità sia ≤ .01 occorrerà che sia k − 2k · 0.47 ≥ 0.99 8 √ √ 2k 0.47 · 0.53 4 ovvero che sia √ Semplificando k − 2k · 0.47 ≥ φ0.99 = 2.43 √ 2k 0.47 · 0.53 √ √ √ k(1 − 2 · 0.47) ≥ 2 0.47 · 0.53 · 2.43 e quindi k≥ √2√0.47 · 0.53 1 − 2 · 0.47 2.43 2 = 817.17 Quindi occorre n = 2 × 818 = 1636. Esercizio 4. a) Ci sono in tutto 1600 · 3 nati e 0 · 224 + 1 · 629 + 2 · 572 + 3 · 175 femmine. Dunque la proporzione di femmine è 0 · 224 + 1 · 629 + 2 · 572 + 3 · 175 = 0.4788 1600 · 3 che è un po’ meno di 21 . b) Sotto l’ipotesi il numero di figlie femmine per famiglia seguirebbe una legge binomiale B(3, 21 ) e le proporzioni attese sarebbero 3 1 1 p0 = = , 0 8 8 3 1 3 p1 = = , 1 8 8 3 1 3 p2 = = , 2 8 8 3 1 1 p3 = = 3 8 8 La statistica di Pearson dunque sarebbe 2 2 1 1 3 1600 − 224 + 1600 − 629 + 8 8 1600 18 1600 38 2 2 3 1 1 1 1600 1600 − 572 − 175 + 8 8 1600 38 1600 18 1 Semplificando, dato che 1 8 1600 = 200, abbiamo 1 1 1 1 (200 − 224)2 + (600 − 629)2 + (600 − 572)2 + (200 − 175)2 = 200 600 600 200 1 1 1 1 576 + 841 + 784 + 625 = 8.71 = 200 600 600 200 Poiché il quantile di ordine 0.95 di una legge χ 2 (3) vale 7.8, l’ipotesi è respinta. 5