UNIVERSITÀ di ROMA TOR VERGATA

annuncio pubblicitario
UNIVERSITÀ di ROMA TOR VERGATA
Corso di Laurea Magistrale in Scienze della Nutrizione Umana
Corso di Statistica Medica, anno 2015-16
P.Baldi
Lista di esercizi 8
Esercizio 1 La precisione della regolazione di una macchina che produce componenti elettronici deve essere 3mm e viene regolarmente verificata.
a1) Vengono fatte n misurazioni e indichiamone con X̄ e S 2 la media e la varianza
campionaria rispettivamente e indichiamo con µ il vero valore (incognito) della regolazione.
Qual è la regione i rigetto dell’ipotesi H0 : µ = 3 contro l’alternativa µ 6= 3 ?
a2) Si è ottenuto X̄ = 3.1 e S 2 = 0.04 con n = 16 misurazioni e supponiamo inoltre che
le misurazioni seguano una legge gaussiana. L’ipotesi può essere respinta al livello 5% ?
a3) Perché nel punto precedente era necessario supporre che le misurazioni fossero
gaussiane ?
b1) Supponiamo invece di sapere che le n misurazioni X1 , . . . , Xn seguano un legge
gaussiana e abbiano una varianza σ 2 nota. Quale sarebbe una regione di rigetto dell’ipotesi
H0 : µ = 3 contro l’alternativa µ 6= 3 ?
b2) Si è ottenuto X̄ = 3.1 e σ 2 = 0.04 con n = 16 misurazioni e supponiamo inoltre
che le misurazioni seguano una legge gaussiana. L’ipotesi può essere respinta al livello
5% ?
Esercizio 2 In un gruppo di pazienti viene sperimentato un farmaco a base di cortisone.
Tra le misurazioni cliniche viene anche osservata la differenza tra il valore del colesterolo
prima e dopo il trattamento.
a1) In un gruppo di n pazienti si osserva una media X̄ per la differenza tra il valore del
colesterolo prima e il valore del colesterolo dopo con uno scarto quadratico pari a S. Qual
è la regione critica di livello α del test di Student per l’ipotesi che il valore del colesterolo
non è cambiato ?
a2) Su un gruppo di 81 pazienti si è osservato un valore X̄ = 2 con S = 10. Si può
respingere al livello 5% l’ipotesi che il valore del colesterolo non è cambiato ?
b) In un gruppo di n pazienti si osserva una media X̄ per la differenza tra il valore del
colesterolo prima e il valore del colesterolo dopo con uno scarto quadratico pari a S. Qual è
la regione critica di livello α dell’ipotesi che il valore del colesterolo non è cresciuto ? Con
i valori in a2), questa ipotesi può essere respinta al livello 5% ?
Esercizio 3 La consistenza del gruppo A in una popolazione è del 47%. Dalla popolazione
viene estratto un campione di numerosità n.
a) Qual è la probabilità che in un campione di numerosità n = 100 ci siano più (>) di
50 individui di tipo A ?
1
b) Qual è la probabilità che in un campione di numerosità n = 400 ci siano più (>) di
200 individui di tipo A ?
c) Quanto grande deve essere scelto n perché la probabilità di avere, in un campione di
numerosità n = 2k, più di k individui di tipo A sia inferiore all’1% ? (per questo punto si
potrà trascurare la correzione di continuità.)
Esercizio 4 In un campione di 1600 famiglie di 3 figli si sono osservate le seguenti numerosità
per quanto riguarda il numero di figlie femmine:
0
224
1
629
2
572
3
175
a) Qual è la proporzione di femmine ?
b) Il test del χ 2 permette di respingere, al livello 5%, l’ipotesi che le nascite siano
indipendenti e che ogni evento produce un maschio o una femmina con probabilità 21 ?
2
Soluzioni
Esercizio 1. a1) La regione di rigetto del test di Student al livello α è
(1)
{|T | ≥ t1−α/2 }
dove T è la statistica di Student
T =
X̄ − µ0 √
n.
S
Occorrerà però supporre che la numerosità n delle osservazioni sia abbastanza grande oppure
che le osservazioni seguano una legge gaussiana.
a2) Con i dati forniti si trova 1 − α2 = 0.975 e
X̄ − µ0 √
3.1 − 3 √
n=
16 = 2 .
S
.2
Confrontando questo valore con il quantile t.975 (15) = 2.13, vediamo che la condizione (1)
non è soddisfatta e l’ipotesi non può essere respinta è respinta al livello 5%.
a3) Come osservato in a1) il test di Student si può applicare solo se la numerosità delle
osservazioni è abbastanza grande oppure se si può supporre che esse sono gaussiane. Qui
le osservazioni sono solo 16 e quindi occorre poter supporre la gaussianità.
b1) Se si conosce la varianza σ 2 delle osservazioni, la regione critica è
(2)
{|Z| ≥ φ1−α/2 }
dove Z è la statistica
Z=
X̄ − µ0 √
n.
σ
b2) Con i dati forniti si trova sempre 1 −
α
2
= 0.975 e
3.1 − 3 √
X̄ − µ0 √
n=
16 = 2 .
σ
0.2
Ora però dobbiamo confrontare questo valore con il quantile φ.975 = 1.96. Dunque la
condizione (2) è soddisfatta e l’ipotesi è respinta al livello 5%.
Esercizio 2. a1) Supporre che il valore del colesterolo non è cambiato significa supporre
che la media delle osservazioni (cioè della differenza tra prima e dopo) è uguale a 0. La
regione critica è quindi
(3)
{|T | ≥ t1−α/2 }
3
dove T è la statistica di Student
(4)
T =
a2) Si ha
T =
X̄ √
n.
S
2 √
9
81 = = 1.8
10
5
Poiché t.975 (80) = 1.99, l’ipotesi non viene respinta.
b) La regione critica ora è
(5)
{T ≥ t1−α }
dove T è sempre la statistica di Student (4). Ovviamente T = 1.8, come in a2), ma adesso
questo valore deve essere confrontato con il quantile t.95 (80) = 1.66 e l’ipotesi è respinta a
questo livello.
Esercizio 3. a) Se indichiamo con Sn il numero d’individui A nel campione, allora usando
la formula dell’approssimazione normale, abbiamo
P(S100
50 + 1 − 100 · 0.47 > 50) = 1 − P(S100 ≤ 50) ' 1 − 8
=
√2
10 0.47 · 0.53
= 1 − 8(0.70) |{z}
= 1 − 0.76 = 0.24
tavole
b) Ripetendo il ragionamento precedente
P(S400
200 + 1 − 400 · .47 > 200) = 1 − P(S400 ≤ 200) ' 1 − 8
=
√2
20 .47 · .53
= 1 − 8(1.25) |{z}
= 1 − 0.89 = 0.11
tavole
c) Abbiamo, senza usare la correzione di contitnuità,
k − 2k · 0.47 P(S2k > k) = 1 − P(S2k ≤ k) ' 1 − 8 √ √
2k 0.47 · 0.53
Perché questa quantità sia ≤ .01 occorrerà che sia
k − 2k · 0.47 ≥ 0.99
8 √ √
2k 0.47 · 0.53
4
ovvero che sia
√
Semplificando
k − 2k · 0.47
≥ φ0.99 = 2.43
√
2k 0.47 · 0.53
√ √
√
k(1 − 2 · 0.47) ≥ 2 0.47 · 0.53 · 2.43
e quindi
k≥
√2√0.47 · 0.53
1 − 2 · 0.47
2.43
2
= 817.17
Quindi occorre n = 2 × 818 = 1636.
Esercizio 4. a) Ci sono in tutto 1600 · 3 nati e 0 · 224 + 1 · 629 + 2 · 572 + 3 · 175 femmine.
Dunque la proporzione di femmine è
0 · 224 + 1 · 629 + 2 · 572 + 3 · 175
= 0.4788
1600 · 3
che è un po’ meno di 21 .
b) Sotto l’ipotesi il numero di figlie femmine per famiglia seguirebbe una legge binomiale B(3, 21 ) e le proporzioni attese sarebbero
3 1
1
p0 =
= ,
0 8
8
3 1
3
p1 =
= ,
1 8
8
3 1
3
p2 =
= ,
2 8
8
3 1
1
p3 =
=
3 8
8
La statistica di Pearson dunque sarebbe
2
2
1
1 3
1600 − 224 +
1600 − 629 +
8
8
1600 18
1600 38
2
2
3
1
1 1 1600
1600
−
572
−
175
+
8
8
1600 38
1600 18
1
Semplificando, dato che
1
8
1600 = 200, abbiamo
1
1
1
1
(200 − 224)2 +
(600 − 629)2 +
(600 − 572)2 +
(200 − 175)2 =
200
600
600
200
1
1
1
1
576 +
841 +
784 +
625 = 8.71
=
200
600
600
200
Poiché il quantile di ordine 0.95 di una legge χ 2 (3) vale 7.8, l’ipotesi è respinta.
5
Scarica