Esercizi di Probabilità e Statistica
Samuel Rota Bulò
6 giugno 2006
Statistica
Esercizio 1 Sia {Xn }n una famiglia di v.a. di media µ e varianza σ 2 . Verificare che
Pn
• X = n1 i=1 Xi
Pn
2
• σ 2 = i=1 (Xi − µ)
2
Pn
1
sono stimatori non distorti rispettivamente di
• S 2 = n−1
i=1 Xi − X
media, varianza con media nota, e varianza.
Soluzione
Per verificare che uno stimatore T di un parametro ψ(θ) non sia distorto
deve valere che
E θ [T ] = ψ(θ)
Verifichiamo lo stimatore della media
n
E θ [X] =
1
1X θ
E [Xi ] = nµ = µ
n i=1
n
Verifichiamo lo stimatore della varianza con media nota
n
E θ [σ 2 ] =
i
1 X θh
2
E (Xi − µ) = σ 2
n i=1
Verifichiamo lo stimatore della varianza





n
X





n

X
1
2
θ
θ
2
θ
2
θ
E S =
E [Xi ] − 2E [X
Xi ] + nE [X ] =

n−1


i=1
i=1




| {z }


=nX
2
=
o
1 n θ 2
2
E [Xi ] − nE θ [X ]
n−1
A questo punto notiamo che dalla definizione di varianza
E θ [Xi2 ] = V ar[Xi ] + E θ [Xi ]2 = σ 2 + µ2
1
2
E θ [X ] = V ar[X] + E θ [X]2 =
e sostituendo
σ2
+ µ2
n
1 2
nσ − σ 2 = σ 2
n−1
Eθ S2 =
Esercizio 2 Sia {Xn }n una famiglia di v.a. di media µ. Dire se i seguenti
n
, T = X1 − 2X5 +
stimatori della media sono distorti. a) T = X1 , T = X1 +X
2
3Xn . Nel caso in cui siano distorti trovare la costante di normalizzazione della
distorsione.
Soluzione
a) Non distorto
E θ [T ] = E θ [X1 ] = µ
b) Non distorto
1 θ
(E [X1 ] + E θ [Xn ]) = µ
2
E θ [T ] =
c) Distorto
E θ [T ] = E θ [X1 ] − 2E θ [X5 ] + 3E θ [Xn ] = 2µ
La costante di normalizzazione è 21 .
Esercizio 3 Sia X1 , X2 un campione di numerosità 2 estratto da una popolazione con distribuzione fX (x) = 2x
θ 2 , con 0 < x < θ.
a) Calcolare media e varianza della popolazione. b) Calcolare media e varianza dei due stimatori di θ:
T1 =
2
1
X1 + X2 ,
3
3
T2 =
1
1
X1 + X2
2
2
c) Quale dei due stimatori di θ è preferibile?
Soluzione
a)
θ
Z
E[X] =
x
0
2
2
Z
V ar[X] = E[X ] − E[X] =
0
θ
θ
2
2 x3 2x
= θ
dx
=
2
2
θ
θ 3 0
3
2x
x2 2
θ
θ
4 2
2 x4 4
dx − θ = 2 − θ2 =
9
θ 4 0 9
=
b)
2
1
2
E[X1 ] + E[X2 ] = θ
3
3
3
1
5 2
4
θ
V ar[T1 ] = V ar[T1 ] + V ar[X2 ] =
9
9
162
1
1
2
E[T2 ] = E[X1 ] + E[X2 ] = θ
2
2
3
E[T1 ] =
2
θ2
4
θ2
− θ2 =
2
9
18
1
1
θ2
V ar[X1 ] + V ar[X2 ] =
4
4
36
c) Entrambi sono stimatori non distori della media della popolazione, tuttavia la varianza di T1 è maggiore di quella di T2 , quindi è preferibile il secondo
stimatore.
V ar[T2 ] =
Esercizio 4 Sia X1 , . . . , Xn un campione casuale semplice estratto da una v.a.
N (µ, σ 2 ), con µ e σ 2 noti. Determinare la distribuzione della statistica
3
T =
n
X
1
1X
Xi +
Xi
6 i=1
2(n − 3) i=4
[T ∼ N (µ, nσ 2 /(12(n − 3)))]
Soluzione
Ricordiamo che una combinazione lineare di una v.a. normale è ancora una
v.a. normale. Determiniamone quindi la media e la varianza
3
E[T ] =
V ar[T ] =
n
X
1
1
1
1X
E[Xi ] +
E[Xi ] = µ + µ = µ
6 i=1
2(n − 3) i=4
2
2
3
n
X
1
1 2
1
1 X
V ar[Xi ] +
V ar[Xi ] =
σ +
σ2 =
2
36 i=1
4(n − 3) i=4
12
4(n − 3)
=
nσ 2
12(n − 3)
nσ 2
Quindi T ∼ N µ, 12(n−3)
.
Esercizio 5 La durata delle telefonate urbane segue una distribuzione normale
di media µ = 10 minuti e scarto quadratico medio σ = 3 minuti. Selezionato
un c.c.s. di 20 telefonate, trovare la distribuzione della media campionaria e
la probabilità che la durata media delle telefonate sia compresa fra 9.5 e 10.3
minuti.
[N(10,0.45), 0.447]
Soluzione
Siccome le osservazioni Xi seguono una legge normale, anche la media cam2
pionaria X lo fa. La media di X è µ, mentre la varianza è data da σn , quindi
X ∼ N (10, 0.45).
Sia Z ∼ N (0, 1)
P {9.5 ≤ X ≤ 10.3} = P
√
√ 10.3 − 10
9.5 − 10
20
≤ Z ≤ 20
3
3
=
= P {−0.74536 ≤ Z ≤ 0.44721} = Φ(0.44721) − Φ(−0.74536) =
= Φ(0.44721) + Φ(0.74536) − 1 = 0.67364 + 0.77337 − 1 = 0.44721
3
Esercizio 6 La resistenza al carico dei sacchetti di plastica utilizzati per contenere generi alimentari segue una distribuzione normale di media 3.2 kg e scarto
quadratico medio 5 Kg. Quale proporzione di sacchetti ha una resistenza al carico tra i 2.8 e i 3.4 Kg? Se si selezionano molti c.c.s di numerosità 30, quale
proporzione di medie campionarie ci si aspetta tra i 2.8 e i 3.4 Kg?
[0.048, 0.257]
Soluzione
Sia X ∼ N (3.2, 25), la v.a. della resistenza al carico dei sacchetti di plastica.
Sia inoltre Z ∼ N (0.1).
P {2.8 ≤ X ≤ 3.4} = P
3.4 − 3.2
2.8 − 3.2
≤Z≤
5
5
=
= P {−0.08 ≤ Z ≤ 0.04} = Φ(0.04) − Φ(−0.08) = Φ(0.04) + Φ(0.08) − 1 =
= 0.51595 + 0.53188 − 1 = 0.04783
√
. Questa per il teorema del limite centrale si approssima
Posto Z = 30 X−3.2
5
con una N (0, 1).
P {2.8 ≤ X ≤ 3.4} = P
√
√ 3.4 − 3.2
2.8 − 3.2
30
≤ Z ≤ 30
5
5
=
= P {−0.43818 ≤ Z ≤ 0.21909} = Φ(0.21909) + Φ(0.43818) − 1 =
= 0.58706 + 0.67003 − 1 = 0.25709
Esercizio 7 La durata in ore delle pile prodotte da una ditta segue una distribuzione normale di media µ = 100 ore e varianza σ 2 ignota. Osservata una
varianza campionaria pari a 400 su un campione di n = 10 pile, quale valore
verrà superato con una probabilità del 95% dalla media campionaria?
[88.406]
Soluzione
√
√
Posto Z = 10 X−100
questa si distribuisce con legge t di Student con 9
400
gradi di libertà.
√
400
+ 100} = P {X > 88.406} = 0.95
P {Z > −t0.95 } = P {X > −t0.95 √
10
Quindi il valore 88.406 viene superato con probabilità del 95% dalla media
campionaria.
Esercizio 8 Si è estratto un campione di 100 abbonati al telefono e di questi 30
avevano la segreteria telefonica. Si vuole stimare qual è, fra tutta la popolazione,
la percentuale di segreterie telefoniche installate con un livello di confidenza di
0.95.
[(0.21018,0.38982)]
Soluzione
3
. Sia
La percentuale di abbonati con segreteria telefonica osservata è X = 10
µ la percentuale da stimare e n = 100.
√
Posto Z = n √ X−µ si distribuisce approssimativamente con legge N (0, 1).
X(1−X)
4
P {|Z| ≤ φ1−0.05/2 } =
q
q



X(1 − X)
X(1 − X) 
√
√
= P X − φ0.975
≤ µ ≤ X + φ0.975


100
100
Un intervallo di confidenza di livello 0.95 per µ è quindi dato da
[0.21018, 0.38982]
Esercizio 9 Avendo osservato il campione (1.2, 3.4, 0.6, 5.6) da una distribuzione normale con σ = 3 si trovi un intervallo di confidenza di livello 0.95 per
la media µ della popolazione. Come cambia l’intervallo se non si conoscesse la
varianza della popolazione?
[(-0.24,5.64), (-0.923, 6.323)]
Soluzione
Innanzitutto calcoliamoci la media campionaria.
X=
1.2 + 3.4 + 0.6 + 5.6
= 2.7
4
e poniamo n = 4.
Un intervallo di confidenza di livello 0.95 per la media della popolazione è
dato da
σ
σ
X − φ1−0.05/2 √ , X + φ1−0.05/2 √
= [−0.23995, 5.6399]
n
n
Pn
1
Se non si conoscesse la varianza, la stimiamo tramite S 2 = n−1
i=1 (Xi −
2
X) = 5.1867. Dal momento che sono ignoti varianza e media, abbiamo il
seguente intervallo di fiducia che fa uso della legge t di Student.
S
S
X − t1−0.05/2 (n − 1) √ , X + t1−0.05/2 (n − 1) √
= [−0.92385, 6.3239]
n
n
Esercizio 10 Una ditta che produce detersivi sostiene che le sue confezioni di
detersivo hanno un peso di 4.4 Kg con una deviazione standard di 0.7 Kg. Un
dettagliante estrae un campione casuale di 50 scatole di detersivo e rileva che il
peso medio è di 4.2 Kg. Verificare se l’affermazione della ditta è da rifiutare ai
livelli di significativitá del 5% e dell’1% supponendo che il peso sia una variabile
normalemente distribuita.
[rifiuto con 0.05, accettazione con 0.01]
Soluzione
L’ipotesi è H : µ ≥ 4.4 contro A : µ < 4.4.
√
Posto Z = 50 X−4.4
questa si distribuisce con legge N (0, 1) per il teorema
0.7
del limite centrale. La regione critica di livello α è data da
(
{Z < −1.644854} α = 0.05
{Z < −φ1−α } =
{Z < −2.33}
α = 0.01
Posto X = 4.2, abbiamo che Z = −2.0203. Questo valore cade nella regione
critica di livello 0.05 ma non in quello di livello 0.01, quindi nel primo caso
abbiamo il rifiuto dell’ipotesi, mentre nel secondo l’accettazione.
5
Esercizio 11 Si sceglie un campione di 10 allievi di una classe; si calcola l’altezza media, che risulta di 170 cm, con uno scarto quadratico medio di 12 cm.
Si vuole verificare, a livello di significatività di 0.01, se l’altezza media degli allievi di tutta la popolazione scolastica con la stessa età è di 165 cm, supponendo
la variabile normalmente distribuita.
[accettazione]
Soluzione
L’ipotesi da verificare
è H :√µ = 165, contro A : µ 6= 165.
√
nσ
√
= 10·12
Calcoliamoci S = √n−1
9
√ X−165
Posto Z = 9 12 questa si distribuisce con legge t di Student con 9 gradi
di libertà. La regione critica di livello 0.01 è data da
{|Z| ≥ t1−0.01/2 (9)} = {|Z| ≥ 3.2499}
Posto X = 170 abbiamo che Z = 1.25 cade fuori dalla regione critica e
quindi l’ipotesi è accettata.
Esercizio 12 Si lancia per 100 volte un dado e risulta che la faccia 6 si è
presentata 30 volte. Si chiede di decidere se il dado è truccato o regolare, ad un
livello di significatività di 0.05.
Soluzione
I lanci del dado seguono una legge bernoulliana di parametro p ignoto.
L’ipotesi da verificare è H : p = 16 , contro A : p 6= 16 .
Poniamo
√
p − 61
Z = 100 q
1
1
6 (1 − 6 )
che segue approssimativamente legge N (0, 1). La regione critica di livello 0.05
è data da
{|Z| ≥ φ1−0.05/2 } = {|Z| ≥ 1.959964}
3
Posto p = 10
abbiamo che Z = 3.5777 cade dentro la regione critica e quindi
l’ipotesi è rifiutata.
Esercizio 13 Siano X 1 , X 2 le medie di due c.c.s. di numerosità n estratti da
una v.a. N (µ, σ 2 ). Determinare per quale valore di n si ha una probabilità del
10% che le due medie differiscano fra loro di più di σ.
[n=6]
Soluzione
Sia Y = X 1 − X 2 . Questa ha legge normale di parametri
µ = E[X 1 − X 2 ] = E[X 1 ] − E[X 2 ] = µ − µ = 0
e
σ 2 = V ar[X 1 − X 2 ] = V ar[X 1 ] + V ar[X 2 ] = 2σ 2
6
√
Sia Z = n Y σ−µ allora abbiamo approssimativamente che Z ∼ N (0, 1) per
il teorema del limite centrale.
√ Y P {|Z| ≥ φ1−0.1/2 } = P n √ ≥ φ0.95 =
2σ
(
√
=P
Da cui
|Y | ≥ φ0.95
2σ
√
n
√
2σ
φ0.95 √ = σ
n
n = 2φ20.95 = 5.4111 ' 6
7
)
= P {|Y | ≥ σ} = 0.1