campione x

PROBABILITA’
Esercizio 1. (dalla prova del 13/01/06-Mod.II) È noto che il 38% dei dipendenti di una multinazionale è di sesso
femminile. Considerando un campione casuale di 18 dipendenti, si determini:
1. la probabilità che non siano di sesso femminile un numero di dipendenti compreso tra 6 e 9;
2. il valore atteso e la varianza del numero di femmine nel campione.
Soluzione:
1. n.ro femmine nel campione = X ~ Bin(18;0,38)
n.ro maschi nel campione = Y ~ Bin(18;0,62)
P(6 ≤ Y ≤ 9) =
9
j =6
2.
18
0,62 j ⋅ 0,3818− j
j
E(X) = 18 0,38
Var(X) = 18 0,38 0,62
Esercizio 2. (dalla prova del 16/06/05-Mod.II) Il consumo elettrico giornaliero (in kw) di una famiglia nel periodo
estivo può essere descritto da una variabile casuale normale con media 8,5 e varianza 6. Sapendo che il costo di un kw è
0,07 €, si calcoli la probabilità che la spesa per consumo elettrico (cioè escludendo la quota fissa) di una famiglia in un
bimestre estivo sia superiore a 30 €.
Soluzione:
consumo giornaliero = X ~ N(8,5;6)
spesa giornaliera = Y =0,07 X ~
spesa bimestrale =
~
Y =
60
i =1
Ponendo Z ~ N(0;1) e
N(0,07 ⋅ 8,5;0,07 2 ⋅ 6)
Yi =N(60 ⋅ 0,07 ⋅ 8,5;60 ⋅ 0,07 2 ⋅ 6) , dove Yi ~ Y sono variabili i.i.d.
= funzione di ripartizione di Z, allora risulta
~
~
30 - E(Y)
30 - E(Y)
30 − 60 ⋅ 0,07 ⋅ 8,5
~
P(Y > 30) = P Z >
= Φ (4,292) ≅ 1.
~ =Φ −
~ = Φ − 0,07 60 ⋅ 6
Var(Y)
Var(Y)
Esercizio 3. (dalla prova del 28/01/05-Mod.II) In un processo produttivo si effettua un controllo a campione per
determinare la qualità della produzione. Sapendo che la probabilità che il processo produca un pezzo difettoso è pari a
0,06, qual è la probabilità di osservare al massimo 20 pezzi difettosi in un campione di 500 pezzi?
Soluzione:
n.ro pezzi difettosi in un campione di 500 pezzi = X ~ Bin(500;0,06)
P(X ≤ 20) =
20
j =1
500
0,06 j ⋅ 0,94 500− j
j
Esercizio 4. (dalla prova del 10/02/06-Mod.II) Un produttore di macchine per il riempimento automatico di lattine di
bevande da 33 cl dichiara nelle specifiche del prodotto che il contenuto effettivo si distribuisce normalmente con media
33 e varianza 16. Assumendo che le specifiche si possano considerare credibili, calcolare:
a.
la probabilità che una lattina contenga meno di 30 cl;
b.
il contenuto medio e la varianza di una confezione da 6 lattine;
c. il valore k tale che Pr( S 2 σ 2 ≥ k ) = 0,01 , dove S 2 è la varianza campionaria di un
campione di 20 lattine.
Soluzione:
contenuto lattine = X ~ N(33;16)
poniamo Z ~ N(0;1) e sia la sua funzione di ripartizione
a. P( X > 30) = P Z >
30 − E ( X )
Var ( X )
=P Z >−
3
3
=Φ
= 0,7734
4
4
b.
contenuto medio di una confezione di 6 lattine = 6 33; varianza della confezione = 6 16
c.
essendo S 2 ~
σ 2 /(n-1) χ 2 (n-1), allora si ha
0,01 = P ( S 2 / σ 2 ≥ k ) = P(19S 2 / σ 2 ≥ 19k ) = P(Y ≥ 19k ) , dove Y~ χ 2
(19).
Dalle tavole abbiamo P(Y 36,19)=0,01, per cui k=36,19/19.
Esercizio 5. (dalla prova del 22/09/05-Mod.II) Si assuma che per un certo tipo di lampadine industriali la durata di
funzionamento, in ore, si distribuisca come una variabile casuale chi-quadrato con 40 gradi di libertà. Si calcoli:
1. la probabilità che su 8 lampadine almeno 1 duri più di 60 ore;
2. la durata media attesa di 10 lampadine.
Soluzione:
durata lampadine = X ~ χ 2 (40)
1. dalle tavole troviamo P(X 60)=0,025 (approssimando 60 al valore più vicino presente nelle
tavole, che è 59,34). Ora, ponendo Y ~ Bin(8;0,025), la probabilità che su 8 lampadine almeno 1
duri più di 60 ore è pari a P(Y 1)=1-P(Y=0)=1- 0,9758 =0,183.
2. durata media di 10 lampadine =10 E(X)= 10 40
Esercizio 6. (dalla prova del 28/01/05-Mod.II) Il diametro dei cilindri prodotti da una data azienda si distribuisce con
media 20mm e varianza 25. Un cliente richiede che in media il diametro dei cilindri si discosti dalla media al massimo
di 1mm. Qual è la probabilità che in una fornitura di 100 cilindri il diametro medio risulti esterno alle specifiche del
cliente?
Soluzione:
data l’ampiezza del campione (n=100), possiamo approssimare la distribuzione della media campionaria
di una normale
N (µ ;σ / n ) = N (20;25 / 100) . Per cui abbiamo:
X con quella
2
P (| X − µ |> 1) = P(| X − 20 |> 1) ) = P( X < 19 ) + P (X > 21) = 2 P( X < 19 ) = 2 P Z <
= 2 P(Z < −2) = 2Φ(−2) = 2(1 − Φ(2)) = 0,046 , con Z ~ N(0;1) e
19 − E ( X )
Var ( X )
= funzione di ripartizione di Z.
=
STIMA PER INTERVALLO E VERIFICA DI IPOTESI
Esercizio 1. (dalla prova del 13/01/06-Mod.II) Le uova prodotte da una azienda avicola hanno un
peso (in grammi) che si distribuisce normalmente con media e varianza 2 = 49. Si determini la
dimensione del campione che consente con una probabilità del 95% di stimare , mediante la media
campionaria, con un errore non superiore in valore assoluto a 4 grammi.
Soluzione:
peso delle uova = X ~ N( ;49)
n = dimensione del campione
media campionaria = X ~ N ( µ ; σ 2 / n)
intervallo fiduciario al 95% : X - z 0,025
σ
σ
n
; X + z 0, 025
σ
n
7 ⋅ 1,96
Richiedendo z 0, 025
= 1,96
≤ 4 , si ottiene n ≥
4
n
n
campionaria soddisfacente la richiesta è n=12.
7
2
, per cui la minima dimensione
Esercizio 2. (dalla prova del 27/01/06-Mod.II) La seguente tabella riporta la distribuzione di un
campione di 112 lavoratori classificati per classi di reddito (in migliaia di € annui) e tipo di
impiego:
Lavoratori dipendenti
Liberi professionisti
Totale
10-20
25
12
37
20-40
33
8
41
40-100
15
19
34
Totale
73
39
112
Si verifichi l'
ipotesi che la proporzione di coloro che guadagnano meno di 40 mila euro l’anno sia la
stessa nei lavoratori dipendenti e nei liberi professionisti, contro l'
alternativa che sia maggiore nei
lavoratori dipendenti, ad un livello α = 0,05.
Soluzione:
abbiamo un campione di ampiezza n 1 =73 da una popolazione Bernoulliana con parametro
p 1 =probabilità che un lavoratore dipendente guadagni meno di 40 mila euro l’anno; e un campione
di ampiezza n 2 =39 da una popolazione Bernoulliana con parametro p 2 =probabilità che un
lavoratore professionista guadagni meno di 40 mila euro l’anno.
X = proporzione (nel campione) dei lavoratori dipendenti che guadagnano meno di 40 mila euro
l’anno;
Y = proporzione (nel campione) dei lavoratori professionisti che guadagnano meno di 40 mila euro
l’anno.
Si deve verificare l’ipotesi nulla H 0 : p1 = p 2 = p , contro l’ipotesi alternativa H 1 : p1 > p 2 .
Considerata l’ampiezza elevata dei campioni, sotto l’ipotesi nulla possiamo approssimare la
distribuzione campionaria della variabile aleatoria (X − Y ) con la normale
N 0; p(1 − p )
1
1
+
n1 n 2
. Essendo la probabilità p incognita, come stimatore della varianza si
n X + n 2Y
1
1
+
considera σˆ (2X −Y ) = pˆ (1 − pˆ )
, con pˆ = 1
. Quindi, in definitiva, la distribuzione
n1 n 2
n1 + n 2
della variabile (X − Y ) è approssimata con una normale N 0; pˆ (1 − pˆ )
1
1
+
n1 n 2
. Da ciò risulta
che la zona di rifiuto del test da effettuare è la seguente: R= {( x − y ) ≥ zα σˆ ( x − y ) }, con =0,05.
25 + 33
12 + 8
=0,795, y =
=0,513, zα = 1,645 , p̂ = 0,696
73
39
= 0,091. Pertanto l’ipotesi nulla viene rifiutata.
Dai dati riportati in tabella si ottiene x =
e σ̂ ( x − y )
Esercizio 3. (dalla prova del 16/06/05-Mod.II) Il reparto qualità di un'
azienda produttrice di forni a
microonde intende procedere al controllo delle radiazioni emesse dai forni a sportello chiuso. Per
questo motivo un campione di 10 forni viene estratto casualmente ed i valori delle radiazioni (in
GHz) emesse sono i seguenti:
0,15 0,09 0,18 0,10 0,05 0,08 0,05 0,08 0,10 0,07
Si verifichi l'
ipotesi che
= 0,10 contro l'
alternativa che sia maggiore ( = 0,05).
Soluzione:
Assumiamo che le radiazioni X emesse da un forno si distribuiscano in modo normale, con =E(X).
Siano X ed S 2 la media e la varianza campionaria delle radiazioni emesse.
Ipotesi nulla: =0,10
Ipotesi alternativa : >0,10
Il test si basa sulla statistica T =
X − µ0
che ha distribuzione t di Student con n-1=9 gradi di
S/ n
libertà, per cui la zona di rifiuto è la seguente: R={t tα = t 0,05 =1,833}.
1 10
1
( xi − x ) 2 =
n − 1 i =1
9
t=-0,382, per cui l’ipotesi nulla viene accettata.
Nel nostro caso abbiamo: x = 0,095 , s 2 =
10
i =1
( xi − 0,095) 2 =0,002, s=0,041,
Esercizio 4. (dalla prova del 13/01/06-Mod.II) Da un’indagine campionaria effettuata dall’Ufficio
statistico di un comune per conoscere il parere dei cittadini su una proposta di adozione di una
nuova modalità di raccolta differenziata dei rifiuti si è trovato quanto segue:
Sesso
Parere
Totale
Favorevoli
Contrari
Indifferenti
Maschi
Femmine
123
144
78
54
19
14
220
212
Totale
267
132
33
432
1. Si verifichi l’ipotesi di indipendenza;
2. Si determini un intervallo fiduciario al 95% per la differenza tra le proporzioni di
favorevoli tra i maschi e le femmine.
Soluzione:
1. Si calcoli l’indice di indipendenza χ =
2
s
t
(nij − nˆ ij ) 2
i =1
j =1
nˆ ij
, con s=2, t=3, n=432 e nˆ ij =
ni n
n
j
.
Dal nostro campione otteniamo:
(123 − 220 ⋅ 267 / 432) 2 (78 − 220 ⋅ 132 / 432) 2
(14 − 212 ⋅ 33 / 432) 2
χ2 =
+
+ ⋅⋅⋅⋅⋅ +
=6,627.
220 ⋅ 267 / 432
220 ⋅ 132 / 432
212 ⋅ 33 / 432
La statistica χ 2 può essere approssimata con una chi-quadrato con (s-1)(t-1)=2 gradi di libertà e
la zona di rifiuto del test di indipendenza (ad un livello di significatività pari a 0,01) è costituita dai
valori molto elevati di tale variabile aleatoria: R={ χ 2 ≥ χ α2 = χ 02, 01 =9,21}. Nel nostro caso, essendo
χ 2 =6,627,l’ipotesi di indipendenza non viene rifiutata.
2. Abbiamo un campione di ampiezza n 1 =220 da una popolazione Bernoulliana con parametro
p 1 =probabilità che un maschio sia favorevole alla proposta; e un campione di ampiezza n 2 =212 da
una popolazione Bernoulliana con parametro p 2 =probabilità che una femmina sia favorevole alla
proposta.
X = proporzione (nel campione) dei maschi favorevoli alla proposta;
Y = proporzione (nel campione) delle femmine favorevoli alla proposta.
Data l’ampiezza campionaria, possiamo approssimare la distribuzione della seguente statistica
X − Y − ( p1 − p 2 )
Z=
con quella di una normale standardizzata. Da ciò si deduce che
X (1 − X ) / n1 + Y (1 − Y ) / n 2
l’intervallo fiduciario per ( p 1 - p 2 ) è il seguente: ( X − Y ) − zα σˆ ( X −Y ) ; ( X − Y ) + zα σˆ ( X −Y ) , dove
2
2
si è posto σˆ ( X −Y ) = X (1 − X ) / n1 + Y (1 − Y ) / n 2 .
123
144
=0,559; y =
=0,679 e σˆ ( x − y ) = 0,002.
220
212
= 1,96 , otteniamo il seguente intervallo fiduciario: [− 0,124;−0,116] .
Dal nostro campione si ottiene x =
Ora, essendo zα = z 0,025
2
Esercizio 5. (dalla prova del 10/02/06-Mod.II) Nell’ambito di un’indagine sulle caratteristiche
genetiche di una popolazione, si è proceduto alla classificazione di un campione casuale di 363
persone secondo il colore dei capelli ed il colore degli occhi:
Colore dei capelli
Bruni
Castani
Rossi
Biondi
Totale
Neri
38
32
9
8
87
Colore degli occhi
Marroni
Azzurri
27
18
47
20
10
19
7
34
91
91
Verdi
18
11
12
32
73
Totale
101
110
50
81
342
Nell'
ambito della popolazione delle persone con i capelli rossi, si determini un intervallo di
confidenza al 90% per la proporzione delle persone con occhi verdi.
Soluzione:
p = proporzione delle persone con occhi verdi nella popolazione delle persone con capelli rossi,
X = proporzione, nel campione, delle persone con occhi verdi tra quelle con i capelli rossi,
n = numerosità campionaria = 50.
Per una numerosità campionaria sufficientemente elevata, la distribuzione della statistica
X−p
Z=
può essere approssimata con quella di una normale standardizzata, per cui si
X (1 − X ) / n
ottiene il seguente intervallo fiduciario per p (con =0,1):
X − zα
2
X (1 − X ) / n ; X + zα
2
X (1 − X ) / n .
12
=0,24, da cui si ricava l’intervallo fiduciario cercato:
50
0,24 − 1,645 0,24 ⋅ 0,76 / 50 ;0,24 + 1,645 0,24 ⋅ 0,76 / 50 .
Dal nostro campione abbiamo x =
(
)
Esercizio 6. (dalla prova del 26/04/05-Mod.II) I dati seguenti si riferiscono all’indice di durezza di
un campione di 10 blocchi di plastica provenienti da una popolazione normale.
283,6
273,3
278,8
238,7
334,9
302,6
239,9
254,6
281,9
270,4
Si determini un intervallo fiduciario al 95% per la varianza della popolazione.
Soluzione:
Si assuma una distribuzione X di tipo normale per la variabile durezza. Un modo naturale di stimare
σ 2 è attraverso la varianza campionaria S 2 ~
intervallo fiduciario per σ 2 : (n − 1)
S2
χα
2
σ2 2
χ (n − 1) . Quindi otteniamo il seguente
n −1
; (n − 1)
2
S2
χ
2
1−α
, dove χ α2 e χ 12−α sono i centili della
2
2
2
distribuzione chi-quadrato con n-1 gradi di libertà, associati alle probabilità /2 e 1- /2
rispettivamente.
283,6 + 273,3 + ⋅ ⋅ ⋅ + 270,4
Dal nostro campione abbiamo: n=10, x =
=275,87 ,
10
1 10
1
( xi − x ) 2 = (283,6 − 275,87) 2 + (273,3 − 275,87) 2 + ⋅ ⋅ ⋅ + (270,4 − 275,87) 2 =829,791
s2 =
10 − 1 i =1
9
Per cui, ad un livello di significatività =0,05, l’intervallo fiduciario cercato è:
[
]
9 ⋅ 829,791 9 ⋅ 829,791
= (392,646;2765,97).
;
2
2
χ 0,025
χ 0,975
Esercizio 7. (dalla prova del 22/09/05-Mod.II) Una banca intende valutare il livello di
soddisfazione dei propri clienti. A tale scopo estrae un campione casuale di clienti e ne misura il
livello di soddisfazione, espresso su di una scala da 0 (per nulla soddisfatto) a 100 (molto
soddisfatto), ed il numero dei mesi di durata del rapporto tra banca e cliente. I dati per un campione
di 15 clienti sono i seguenti:
livello di soddisfazione 51 3 26 24 76 30 38 27 14 37 32 18 16 75 13
Durata del rapporto
5 17 10 20 2 24 25 32 35 10 66 51 45 92 11
Supponendo valide le assunzioni del modello di regressione lineare, si stimino i coefficienti del
modello y = β0 + β1 x + ε , dove y esprime il livello di soddisfazione del cliente e x la durata del
rapporto; inoltre, si verifichi l’ipotesi β1 = 0 contro l’alternativa che sia maggiore, al livello α =
0,05.
Soluzione:
n
Dai dati riportati in tabella si ottiene: x =29,667, y =32, β̂ 1 =
i =1
( xi − x )( y i − y )
n
i =1
=0,1813 e
( xi − x ) 2
βˆ 0 = y − βˆ1 x =23,864. Sotto l’usuale ipotesi di normalità della variabile , ovvero ~ N (0;σ 2 ) ,
risulta y ~ N ( β + β x, σ 2 ) , per cui anche gli stimatori βˆ , βˆ si distribuiscono normalmente. In
0
0
1
particolare si ha β̂ 1 ~ N β 1 ,
Poiché la varianza σ
n
DR
=
n−2
essendo
i =1
DR
2
, dove D x =
Dx
n
i =1
xi2 − nx 2 =
1
15
i =1
xi2 − 15 ⋅ 29,667 2 =8733,333.
non è nota, la stimiamo con DR/(n-2) (stimatore non distorto), che è pari a:
y i2 − ny 2 − βˆ12 D x
n−2
σ
2
σ
2
15
=
i =1
y i2 − 15 ⋅ 32 2 − 0,1813 2 ⋅ 8733,333
13
~ χ 2 (n − 2) = χ 2 (13) , è noto che la statistica T =
= 463,611. A questo punto,
βˆ1 − β 1
DR
(n − 2) D x
ha distribuzione t di
Student con (n-2)=13 gradi di libertà.
Ora dobbiamo verificare l’ipotesi nulla H 0 : β 1 = 0 , contro l’ipotesi alternativa H 1 : β 1 > 0 .
βˆ1
Sotto l’ipotesi nulla abbiamo che il rapporto T =
ha distribuzione t di Student con 13
DR
(n − 2) D x
gradi di libertà, da cui si ottiene la zona di rifiuto R={t : t ≥ tα }. Dai nostri dati si trova
0,1813
t=
=0,787<1,771= tα , per cui l’ipotesi nulla viene accettata.
463,611
8733,333
Esercizio 8. (dalla prova del 28/01/05-Mod.II) . La seguente tabella riporta la distribuzione di un
campione di 242 lavoratori classificati per classi di reddito (in migliaia di euro annui) e tipo di
impiego:
10-20
20-40
40-80
Totale
52
22
74
58
50
108
6
54
60
116
126
242
Lavoratori dipendenti
Liberi professionisti
Totale
1. Si verifichi l’ipotesi che la retribuzione media dei lavoratori dipendenti sia pari a 25 mila euro
contro l’alternativa che sia inferiore ( = 0,01).
2. Con riferimento al punto precedente, si calcoli il livello di significatività osservato.
3. Si determini un intervallo fiduciario al 95% per il reddito medio dei lavoratori dipendenti.
4. Si determini un intervallo fiduciario al 99% per il reddito medio dei liberi professionisti.
Soluzione:
1. X = retribuzione lavoratori dipendenti
Sia µ = E ( X ) e µ 0 = 25 mila euro
Ipotesi nulla: µ = µ 0
Ipotesi alternativa: µ < µ 0
X −µ
può essere approssimata con una normale
S n
k
n k
1 k
1 k
N(0,1), dove X =
X i ni =
X i fi e S 2 =
( X i − X ) 2 ni =
( X i − X ) 2 f i sono la
n i =1
n
−
1
n
−
1
i =1
i =1
i =1
media e la varianza campionaria di una distribuzione in k classi, con medie di classe X i ,
n
numerosità di classe ni e frequenze di classe f i = i . Per cui la zona di rifiuto del test è data da
n
R = ( x , s) : x ≤ µ 0 − zα s n , dove zα = z 0, 01 =2,326.
Per grandi campioni sappiamo che la statistica
{
}
Dai dati riportati in tabella abbiamo x = (15 52+30 58+60 6)/116=24,828,
1
s2 =
(15 − 24,828) 2 ⋅ 52 + (30 − 24,828) 2 ⋅ 58 + (60 − 24,828) 2 ⋅ 6 =121,709, s=11,032.
115
In questo modo otteniamo µ 0 − zα s n = 25 − 2,326 ⋅ 11,032 116 =22,617<24,828 = x , per cui si
accetta l’ipotesi nulla.
[
]
2. Livello di significatività osservato = γ = P ( X ≤ x | µ = µ 0 ) = P Z ≤
Indicando con
γ =Φ
x − µ0
s
n
, dove Z ~ N(0,1).
la funzione di ripartizione di Z, si ottiene
x − µ0
= Φ (−0,168) = 1 − Φ (0,168) ≅ 1 − 0,5675 = 0,4325 .
s n
3. Per il ragionamento fatto al punto 1., l’intervallo fiduciario per µ al 95% è il seguente:
(x − z
α 2
s
n , x + zα 2 s
) (
n = 24,828 − 1,96 ⋅ 11,032
116 ,24,828 + 1,96 ⋅ 11,032
)
116 .
4. Poniamo Y= retribuzione lavoratori professionisti, η = E (Y ) e S Y2 = varianza campionaria di Y.
Analogamente al punto 3. troviamo l’intervallo fiduciario per η al 99%:
(y − z
α 2
sy
n , y + zα 2 s y
)
n = (40,238-2,576 45,954/11,18 ; 40,238+2,576 45,954/11,18).
Esercizio 9. (dalla prova del 26/04/05-Mod.II) Nella tabella seguente sono riportati i risultati di
un’indagine condotta su un campione di residenti in Umbria di 6 anni e più classificati secondo il
sesso e il numero di spettacoli teatrali visti negli ultimi 12 mesi.
N. spettacoli
0-3
4-6
7 - 12
più di 12
Totale
Maschi
Femmine
260
37
20
10
327
253
48
29
14
344
1. Si verifichi l’ipotesi che il numero medio di spettacoli visti negli ultimi 12 mesi sia lo stesso tra i
maschi e le femmine (per il calcolo delle medie si prenda 20 come estremo destro dell’ultima
classe) contro l’alternativa che sia diverso (α = 0,05).
2. Si determini la potenza del test per la verifica dell’ipotesi che la proporzione delle femmine che
hanno visto più di 6 spettacoli negli 12 mesi sia pari a 0,10 contro l’alternativa che sia pari a 0,12 (α
= 0,05).
Soluzione:
1. X=spettacoli visti dai maschi negli ultimi 12 mesi, =E(X)
Y= spettacoli visti dalle femmine negli ultimi 12 mesi, =E(Y)
Ipotesi nulla: =
Ipotesi alternativa:
Data l’elevatezza delle ampiezze campionarie ( n1 = 327 e n 2 = 344 ), la distribuzione di ( X − Y )
sotto l’ipotesi nulla può essere approssimata con una normale N (0, S12 / n1 + S 22 n 2 ), per cui la zona
{
}
di rifiuto del nostro test è: R= ( x − y ) :| x − y |≥ zα 2 s12 n1 + s 22 n2 .
2
1
2
2
Dai dati in tabella otteniamo x = 2,844, y = 3,273, s = 10,407, s = 13,155. Quindi abbiamo
y − x = 0,429 e zα 2 s12 n1 + s 22 n2 = 1,96 10,407 327 + 13,155 344 =0,519, per cui l’ipotesi
nulla viene accettata.
2. Si determini innanzitutto la zona di rifiuto del test a una coda con ipotesi nulla H 0 : “proporzione
delle femmine che hanno visto più di 6 spettacoli = 0,10” e ipotesi alternativa H 1 : “proporzione
delle femmine che hanno visto più di 6 spettacoli > 0,10”. Siamo nel caso di una popolazione
Bernoulliana con parametro p= “proporzione di femmine che hanno visto più di 6 spettacoli”, per
cui la verifica di ipotesi sulla media p (con H 0 : p = p0 = 0,10 e H 1 : p > p0 ) si basa sulla media
campionaria X . Per campioni di ampiezza elevata (come nel caso in esame, in cui n=344)
sappiamo che, sotto l’ipotesi nulla, la distribuzione di X può essere approssimata con quella di una
normale X ~ N ( p 0 , p0 (1 − p0 ) / n) . Di conseguenza la zona di rifiuto del nostro test è
R= {x : x ≥ p0 + zα
p0 (1 − p 0 ) / n} .
Calcoliamo ora la potenza del test per la verifica dell’ipotesi H 0 : p = p0 = 0,10 contro l’alternativa
H 1 : p = p1 = 0,12 : π = P ( R | p = p1 ) = P ( X ≥ p 0 + zα
p = p1 si ha X ~ N ( p1 , p1 (1 − p1 ) / n) , per cui
p 0 (1 − p 0 ) / n | p = p1 ) . Sotto l’ipotesi
π = P( X ≥ p0 + zα p0 (1 − p0 ) / n | p = p1 ) = P Z ≥
P Z≥
0,1 + 2,576 ⋅ 0,1 ⋅ 0,9 / 344 − 0,12
0,12 ⋅ 0,88 / 344
p 0 + zα
p 0 (1 − p 0 ) / n − p1
p1 (1 − p1 ) / n
= 1 − Φ (1,256) ≅ 0,1038 .
=