Esercizi di Metodi Statistici per la Biologia Francesco Caravenna Foglio 7. (25–29 febbraio 2008) Esercizio 1. Si misura la concentrazione nell’aria di una certa sostanza in 50 punti diversi di una città, ottenendo un valore medio x = 6.35 (espresso in opportune unità di misura). Si assuma che la concentrazione di questa sostanza segua una distribuzione Normale di media incognita µ e varianza nota σ 2 = 3. b) Si effettui un test all’1% sull’ipotesi H0 : µ ≥ 6.9 e si determini il p-value. x−µ √ 0 < −z0.01 . Dato che z = 6.35−6.9 = −2.25 e −z0.01 = [Rifiuto H0 se z = σ/ 1.73/7.07 n −2.326, H0 è accettata. p-value: α = Φ(−2.25) ≈ 0.012] Esercizio 2. Un laboratorio farmaceutico sta elaborando un farmaco che dovrebbe ridurre la frequenza cardiaca a riposo di almeno 4 battiti al minuto. Per testarne l’effetto, viene somministrato il farmaco a un gruppo di 25 volontari. Per ciascun volontario, si misura la diminuzione di frequenza cardiaca: la media e la deviazione standard empirica di tali dati (espressi in battiti al minuto) sono x = 5.3 e s = 4.8. a) Da questi dati si può inferire che il farmaco abbia avuto l’effetto previsto? √ 0 > t0.05,24 ; dato (Effettuare un test al 5%) [H0 : µ ≤ 4; Rifiuto H0 se t = x−µ s/ n che t = 1.354 e t0.05,24 = 1.71, H0 è accettata] b) Si determini l’intervallo di confidenza unilatero destro al 95% per il valore atteso della diminuzione di frequenza cardiaca. [(x − t0.05 √sn , ∞) = (5.3 − 1.71 4.8 , ∞) = (3.658, ∞)] 5 Esercizio 3. a) Lancio una moneta 100 volte, ottenendo 41 teste. Posso concludere, all’1% di significatività, che la moneta √ ètruccata? Si calcoli il p-value. [Il p-value vale 2(1 − Φ (0.41 − 0.5) · 2 · 100 = 2(1 − Φ(1.8)) ≈ 0.07, quindi H0 : p = 0.5 è accettata all’1%.] b) Lancio una moneta 1000 volte, ottenendo 545 teste. Posso concludere, all’1% di significatività, Si calcoli il p-value. [Il p-value che la moneta √è truccata? vale 2(1 − Φ (0.545 − 0.5) · 2 · 1000 = 2(1 − Φ(2.846)) ≈ 0.004, quindi H0 : p = 0.5 è rifiutata all’1%.] Esercizio 4. Si misura la quantità di N O2 presente nell’aria di Padova, facendo 8 rilevazioni in diverse zone della città e ottenendo un valore medio campionario pari a x = 115µg/m3 e una deviazione standard campionaria pari a sx = 17µg/m3 . Si misura la stessa sostanza a Milano, facendo 13 rilevazioni e ottenendo un valore medio campionario pari a x = 101µg/m3 e una deviazione standard campionaria pari a sy = 14µg/m3 . Al 5% di significatività, si può concludere che il valore 1 2 medio di N O2 presente a Padova sia maggiore di quello presente a Milano? [Da2 to che ssx2 ∈ (0.5, 2) posso applicare il test nell’ipotesi di varianze uguali. Si ha y s2p = 7·(17)2 +12·(14)2 19 = 230.2632 per cui t = √ 115−101 √ 230.2632· 1/8+1/13 = 14 6.82 ≈ 2.05. Dato che t19,0.05 = 1.73, H0 : µx ≤ µy è rifiutata al 5%.] Esercizio 5. Si teme che la somministrazione di un farmaco abbia come effetto indesiderato l’aumento della pressione sanguigna sistolica. Si prendono in considerazione 6 individui e si misura su ciascuno il valore della pressione sanguigna prima e dopo l’assunzione del farmaco, ottenendo i seguenti valori: Paziente Prima Dopo 1 134 140 2 132 135 3 130 126 4 118 124 5 127 126 6 142 144 Si può concludere, al 5% di significatività, che il farmaco abbia davvero l’effetto collaterale temuto? [Le differenze tra i valori della pressione dopo e prima della somministrazione valgono: 6 3 − 4 6 − 1 2. Media e varianza di questi dati valgono x = 2 e s2 = 15.6. L’ipotesi nulla H0 : µ ≤ 0 viene rifiutata al 5% se t > t5,0.05 . Dato che t = s/x√6 ≈ 1.24 mentre t5,0.05 = 2.015, H0 è accettata al 5%.] Esercizio 6. Viene misurato il livello di colesterolo totale in un gruppo di 22 femmine che seguono una dieta vegetariana, ottenendo una media campionaria di 188 (mg/100 mL) e una deviazione standard campionaria di 17. È noto che il livello di colesterolo totale nell’intera popolazione femminile ha media 200 (mg/100 mL). (a) Questi dato mostrano una differenza significativa nel livello medio di colesterolo nel gruppo che segue dieta vegetariana rispetto all’intera popolazione femminile (eseguire un test al 5%)? [Si esegue un t-test per verificare l’ipotesi H0 : µ = µ0 . La statistica vale √ 0 | = | 188−200 √ | = 3.31 > 2.07 = t21,0.025 , per cui l’ipotesi H0 è |t| = | x−µ s/ n 17/ 22 rifiutata al 5%.] Vengono quindi esaminati 18 maschi vegetariani, ottenendo una media campionaria di 191 e una deviazione standard campionaria di 19. (b) Si può concludere che il livello medio di colesterolo dei maschi vegetariani sia maggiore di quello delle femmine vegetariane (eseguire un test al 5%)? [Si effettua un test per il confronto di medie per campioni indipendenti: dato che s2f /s2m = 172 /192 = 0.8 ∈ ( 12 , 2), si può procedere. La varianza 3 (nf −1)s2f +(nm −1)s2m nf +nm −2 campionaria combinata vale s2p = x −x √ = √ 188−191 vale t = √ f m sp 1/nf +1/nm 321.21 1/21+1/18 = 321.21 e la statistica = −0.52 > −1.68 = t38,0.05 , quindi l’ipotesi H0 : µf > µm è accettata al 5%.] Esercizio 7. In un test per la verifica di una determinata ipotesi H0 , i dati del campione portano a rifiutare H0 al 5% di significatività. Indicando con α il p-value, si può certamente concludere che α > 0.05; α < 0.05; α = 0.05; nessuna delle precedenti. Esercizio 8. L’ampiezza dell’intervallo di confidenza per la media di un campione normale con varianza nota dipende dal valore dei dati, oltre che dalla taglia n del campione; dipende dalla taglia n del campione, ma non dal valore dei dati; ha distribuzione normale; ha distribuzione t di Student. Esercizio 9. Sia ∆ l’ampiezza dell’intervallo di confidenza per la media di un campione normale di n dati con varianza nota σ 2 . Impiegando un campione di 4n dati, tenendo immutati il livello di confidenza e σ 2 , la nuova ampiezza dell’intervallo di confidenza vale 4∆; ∆4 ; ∆2 ; bisogna conoscere il valore di σ 2 per poterlo dire.