Foglio di esercizi n. 7

annuncio pubblicitario
Esercizi di Metodi Statistici per la Biologia
Francesco Caravenna
Foglio 7. (25–29 febbraio 2008)
Esercizio 1. Si misura la concentrazione nell’aria di una certa sostanza in 50 punti
diversi di una città, ottenendo un valore medio x = 6.35 (espresso in opportune
unità di misura). Si assuma che la concentrazione di questa sostanza segua una
distribuzione Normale di media incognita µ e varianza nota σ 2 = 3.
b) Si effettui un test all’1% sull’ipotesi H0 : µ ≥ 6.9 e si determini il p-value.
x−µ
√ 0 < −z0.01 . Dato che z = 6.35−6.9 = −2.25 e −z0.01 =
[Rifiuto H0 se z = σ/
1.73/7.07
n
−2.326, H0 è accettata. p-value: α = Φ(−2.25) ≈ 0.012]
Esercizio 2. Un laboratorio farmaceutico sta elaborando un farmaco che dovrebbe
ridurre la frequenza cardiaca a riposo di almeno 4 battiti al minuto. Per testarne
l’effetto, viene somministrato il farmaco a un gruppo di 25 volontari. Per ciascun
volontario, si misura la diminuzione di frequenza cardiaca: la media e la deviazione
standard empirica di tali dati (espressi in battiti al minuto) sono x = 5.3 e s = 4.8.
a) Da questi dati si può inferire che il farmaco abbia avuto l’effetto previsto?
√ 0 > t0.05,24 ; dato
(Effettuare un test al 5%) [H0 : µ ≤ 4; Rifiuto H0 se t = x−µ
s/ n
che t = 1.354 e t0.05,24 = 1.71, H0 è accettata]
b) Si determini l’intervallo di confidenza unilatero destro al 95% per il valore
atteso della diminuzione di frequenza cardiaca. [(x − t0.05 √sn , ∞) = (5.3 −
1.71 4.8
, ∞) = (3.658, ∞)]
5
Esercizio 3. a) Lancio una moneta 100 volte, ottenendo 41 teste. Posso concludere, all’1% di significatività,
che la moneta
√ ètruccata? Si calcoli il p-value. [Il
p-value vale 2(1 − Φ (0.41 − 0.5) · 2 · 100 = 2(1 − Φ(1.8)) ≈ 0.07, quindi
H0 : p = 0.5 è accettata all’1%.]
b) Lancio una moneta 1000 volte, ottenendo 545 teste. Posso concludere, all’1%
di significatività,
Si calcoli il p-value. [Il p-value
che la moneta Ï truccata?
vale 2(1 − Φ (0.545 − 0.5) · 2 · 1000 = 2(1 − Φ(2.846)) ≈ 0.004, quindi
H0 : p = 0.5 è rifiutata all’1%.]
Esercizio 4. Si misura la quantità di N O2 presente nell’aria di Padova, facendo
8 rilevazioni in diverse zone della città e ottenendo un valore medio campionario
pari a x = 115µg/m3 e una deviazione standard campionaria pari a sx = 17µg/m3 .
Si misura la stessa sostanza a Milano, facendo 13 rilevazioni e ottenendo un valore
medio campionario pari a x = 101µg/m3 e una deviazione standard campionaria pari a sy = 14µg/m3 . Al 5% di significatività, si può concludere che il valore
1
2
medio di N O2 presente a Padova sia maggiore di quello presente a Milano? [Da2
to che ssx2 ∈ (0.5, 2) posso applicare il test nell’ipotesi di varianze uguali. Si ha
y
s2p
=
7·(17)2 +12·(14)2
19
= 230.2632 per cui t =
√
115−101
√
230.2632· 1/8+1/13
=
14
6.82
≈ 2.05. Dato che
t19,0.05 = 1.73, H0 : µx ≤ µy è rifiutata al 5%.]
Esercizio 5. Si teme che la somministrazione di un farmaco abbia come effetto
indesiderato l’aumento della pressione sanguigna sistolica. Si prendono in considerazione 6 individui e si misura su ciascuno il valore della pressione sanguigna prima
e dopo l’assunzione del farmaco, ottenendo i seguenti valori:
Paziente Prima Dopo
1
134
140
2
132
135
3
130
126
4
118
124
5
127
126
6
142
144
Si può concludere, al 5% di significatività, che il farmaco abbia davvero l’effetto
collaterale temuto?
[Le differenze tra i valori della pressione dopo e prima della somministrazione
valgono:
6 3 − 4 6 − 1 2.
Media e varianza di questi dati valgono x = 2 e s2 = 15.6. L’ipotesi nulla H0 : µ ≤ 0
viene rifiutata al 5% se t > t5,0.05 . Dato che t = s/x√6 ≈ 1.24 mentre t5,0.05 = 2.015,
H0 è accettata al 5%.]
Esercizio 6. Viene misurato il livello di colesterolo totale in un gruppo di 22 femmine che seguono una dieta vegetariana, ottenendo una media campionaria di 188
(mg/100 mL) e una deviazione standard campionaria di 17. È noto che il livello di
colesterolo totale nell’intera popolazione femminile ha media 200 (mg/100 mL).
(a) Questi dato mostrano una differenza significativa nel livello medio di colesterolo nel gruppo che segue dieta vegetariana rispetto all’intera popolazione
femminile (eseguire un test al 5%)?
[Si esegue un t-test per verificare l’ipotesi H0 : µ = µ0 . La statistica vale
√ 0 | = | 188−200
√ | = 3.31 > 2.07 = t21,0.025 , per cui l’ipotesi H0 è
|t| = | x−µ
s/ n
17/ 22
rifiutata al 5%.]
Vengono quindi esaminati 18 maschi vegetariani, ottenendo una media campionaria
di 191 e una deviazione standard campionaria di 19.
(b) Si può concludere che il livello medio di colesterolo dei maschi vegetariani
sia maggiore di quello delle femmine vegetariane (eseguire un test al 5%)?
[Si effettua un test per il confronto di medie per campioni indipendenti:
dato che s2f /s2m = 172 /192 = 0.8 ∈ ( 12 , 2), si può procedere. La varianza
3
(nf −1)s2f +(nm −1)s2m
nf +nm −2
campionaria combinata vale s2p =
x −x
√
= √ 188−191
vale t = √ f m
sp
1/nf +1/nm
321.21
1/21+1/18
= 321.21 e la statistica
= −0.52 > −1.68 = t38,0.05 , quindi
l’ipotesi H0 : µf > µm è accettata al 5%.]
Esercizio 7. In un test per la verifica di una determinata ipotesi H0 , i dati del
campione portano a rifiutare H0 al 5% di significatività. Indicando con α il p-value,
si può certamente concludere che
α > 0.05;
α < 0.05;
α = 0.05;
nessuna delle precedenti.
Esercizio 8. L’ampiezza dell’intervallo di confidenza per la media di un campione
normale con varianza nota
dipende dal valore dei dati, oltre che dalla taglia n del campione;
dipende dalla taglia n del campione, ma non dal valore dei dati;
ha distribuzione normale;
ha distribuzione t di Student.
Esercizio 9. Sia ∆ l’ampiezza dell’intervallo di confidenza per la media di un campione normale di n dati con varianza nota σ 2 . Impiegando un campione di 4n dati,
tenendo immutati il livello di confidenza e σ 2 , la nuova ampiezza dell’intervallo di
confidenza vale
4∆;
∆4 ;
∆2 ;
bisogna conoscere il valore di σ 2 per poterlo dire.
Scarica