Università degli Studi di Bologna “Alma Mater Studiorum” Facoltà di

Esercizio 1.
Un’azienda che produce carne in scatola ha attivato in due differenti filiali due distinte
linee di produzione per la realizzazione del medesimo prodotto. La linea della filiale
A ha una produzione giornaliera (in peso lordo) che varia secondo una andamento
normale con media 7.5 T e varianza 5.7 T2; la linea della filiale B ha invece una
produzione giornaliera che varia secondo una andamento normale con media 6.5 T
e varianza 0.75 T2.
Università degli Studi di Bologna
“Alma Mater Studiorum”
Facoltà di Economia – Forlì
a) A quanto ammonta la probabilità che la linea della filiale A produca in un giorno
una quantità di prodotto compresa fra 4.5 e 4.7 T? e la medesima probabilità per la
linea della filiale B? Commenta il risultato.
b) Per quale valore della produzione nella della filiale A, la probabilità di avere una
produzione maggiore è pari a 0.14457? E per quale valore si ha invece una
produzione maggiore con probabilità pari a 0.5?
Corso di:
c) Qual è la probabilità che le due filiali abbiano una produzione che differisce
esattamente di 1 T?
Metodi Statistici per L’Economia e per L’Impresa
prof.ssa Maria Rosaria Ferrante
d) Qual è la probabilità che la linea A abbia rispetto alla linea B, una produzione
maggiore per un valore compreso fra 5.9 e 7 T?
Esercitazione 6 – 05 Dicembre 2005
Michele Modica
e-mail: [email protected]
e) Qual è la probabilità che la produzione delle due linee differisca più di 1,5 T?
1
P(Z ≤ −1.26 ) = P(Z ≥ 1.26 ) = 1 − P(Z ≤ 1.26) = 1 − 0.87617 =
= 0.10383
Quesito a)
definendo:
2
X A = quantità prodotta dalla filiale " A"
X = quantità prodotta dalla filiale " B"
si ha quindi che:
B
la probabilità cercata relativamente alla filiale A, è data da:
 4.5 − 7.5 X A − µ A 4.7 − 7.5 
=
P(4.5 ≤ X A ≤ 4.7 ) = P
≤
≤

2
5
.
7
5
.
7
σ


3
2.8 

= P −
≤Z ≤−
 = P(− 1.26 ≤ Z ≤ −1.17 ) =
2.39 
 2.39
= P(Z ≤ −1.17 ) − P(Z ≤ −1.26 )
dato che nelle tavole disponiamo solo delle probabilità cumulate per valori positivi,
sfruttando la proprietà di simmetria della normale rispetto alla media, si ha che:
P(Z ≤ −1.17 ) = P(Z ≥ 1.17 ) = 1 − P(Z ≤ 1.17 ) = 1 − 0.879 =
= 0.121
3
P(4.5 ≤ X A ≤ 4.7 ) = P(− 1.26 ≤ Z ≤ −1.17 ) = 0.121 − 0.10383 =
= 0.015992
Per quanto concerne invece la linea B, si ha che
 4.5 − 6.5 X − µ
4.7 − 5.5 
B
P(4.5 ≤ X B ≤ 4.7 ) = P
≤ B
≤
=
2
 0.75

0
.
75
σ
B


2
1.8 

= P −
≤Z ≤−
 = P(− 2.3 ≤ Z ≤ −2.07 ) =
0.87 
 0.87
= P(Z ≤ −2.07 ) − P(Z ≤ −2.3)
P(Z ≤ −2.3) = P(Z ≥ 2.3) = 1 − P(Z ≤ 2.3) = 1 − 0.98928 = 0.01072
4
P(Z ≤ −2.07 ) = P(Z ≥ 2.07 ) = 1 − P(Z ≤ 2.07 ) = 1 − 0.98077 =
= 0.01923
si ha quindi che per la linea B:
XB
P(4.5 ≤ X B ≤ 4.7 ) = P(− 2.3 ≤ Z ≤ −2.07 ) = 0.01923 − 0.01072 =
= 0.00851
commento:
in questo caso anche se la distribuzione della linea B è posizionata più vicino
all’intervallo considerato rispetto a a quella della linea A (lo si nota ovviamente dal
valore della media), ha una probabilità più bassa in relazione al medesimo. Ciò è
dovuto al fatto che la prima ha una variabilità molto più contenuta rispetto alla
seconda, ciò implica nella XA un addensamento della probabilità maggiore nelle
code (e quindi anche nell’intervallo considerato), rispetto a XB, in cui la probabilità
si addensa maggiormente nel valore medio.
XA
5
quesito b)
~
La quantità di produzione x per la quale si ha una probabilità di 0.14457 di avere
A
una produzione maggiore, verifica la seguente condizione:
P( X A > ~
x A ) = 0.14457
6
segue che il valore cercato è ottenuto come riportato
~
xA − µ A

~
~
xA − µ A
x A − 7. 5
=~
z
⇒
=
1
.
06
⇒
= 1.06

σ
2
.
39
σ
~
1.06 = z 
~
x A − 7.5 = 1.06 ⋅ 2.39 ⇒ ~
x A = 7.5 + 2.533 = 7.033
che per le “buone” caratteristiche analitiche della distribuzione normale, equivale
a:
P( X A > ~
x A ) = P( X A ≤ ~
x A ) = 1 − 0.14457 = 0.85543
P( X A > 7.033) = 0.14457
in conclusione:
quesiti c-d)
standardizzando si ha:
x − µA 
 X A − µA ~
~
P ( X A ≤ x A ) = P
≤ A
z ) = 0.85543
 = P (Z ≤ ~
σ
σ


individuando sulle tavole il valore delle probabilità 0.85543, si nota che questo si ha in
corrispondenza di:
Per risolvere tali quesiti è utile considerare una nuova variabile casuale:
Y =X −X
A
B
che rappresenta la differenza di produzione tra la linea A e quella B. E’ noto che
tale variabile si distribuisce secondo una normale con media data dalla differenza
delle medie delle v.c. e varianza la somma delle rispettive varianze.
(
Y ~ N µY , σ Y2
~
z = 1.06
7
)
 µ = µ − µ = 7.5 − 6 = 1
con  2 Y 2 A 2 B
σ Y = σ A + σ B = 5.7 + 0.75 = 6.45
8
la risposta al quesito c) è in ogni caso 0, dato che basta osservare che la differenze
tra le due produzioni, in ogni caso (cioè sia se si considera XA-XB che XB-XA) è
comunque una variabile normale, quindi continua, il che implica che la probabilità
che assuma un preciso valore è comunque zero! Più formalmente si può comunque
scrivere che:
P(Y = 1) = P(− Y = 1) = 0
per il quesito d) per quanto detto sopra, basta determinare, in modo analogo al punto
b), la seguente probabilità:
 5.9 −1 Y − µ
7 −1   4.9
6 
Y
P(5.9 ≤ Y ≤ 7) = P
≤
≤
= P
≤Z ≤
=
2
 6.45
  2.54
2
.
54
6
.
45

σ
Y


= P(1.93 ≤ Z ≤ 2.36) = P(Z ≤ 2.36) − P(Z ≤ 1.93) =
= 0.99086− 0.97320= 0.0177
9
10
quesito e)
Esercizio.
Considerare l’evento che le due linee abbiano una produzione che differisce di più di
1.5 T, per le definizioni impostate al punto precedente significa considerare
contemporaneamente le due situazioni:
Si è interessati a stimare l’altezza media degli studenti della facoltà di Economia; In
teoria si potrebbe rilevare la statura di ogni studente, ma essendo la procedura
troppo costosa si preferisce estrarre a caso 10 studenti dalla lista degli iscritti e
misurarne la statura. A riguardo si è osservato il seguente campione:
 X A − X B > 1.5

 X B − X A > 1.5
da cui segue:
(x1 , x2 ,..., x10 ) = (175, 171, 173, 189, 188, 160,177, 188, 167, 174)
a) formula adeguate ipotesi sulla popolazione;
 X A − X B > 1.5
 Y > 1.5
⇒

Y < −1.5
 X A − X B < −1.5
b) indica un possibile stimatore della grandezza considerata, giustificando la
scelta;
c) è possibile affermare qualcosa sulla distribuzione dello stimatore scelto?
dunque la probabilità cercata è data da:
d) stimare la grandezza di interesse in base al campione considerato.
P(Y > 1.5 ∪ Y < −1.5) = P(Y > 1.5) + P(Y < −1.5)
  Y − µY 1.5 −1 
 =
= 2[1- P(Y < 1.5)] = 21- P
<
2.54 
  σY
= 2[1- P(Z < 0.2)] = 2[1 − 0.57926] = 2 ⋅ 0.42074=
= 0.841481
11
12
quesito a)
In questo caso la popolazione in esame è costituita dalle altezze di individui;
l’andamento di tale carattere è ben descritto da una variabile casuale di tipo
Normale. Quindi ciascuna altezza può essere considerata come una particolare
realizzazione di una variabile aleatoria del tipo:
(
xi ~ N µ , σ 2
)
questa scelta è giustificata dal fatto che l’altezza, come del resto la maggior parte
dei caratteri di natura antropomorfa, presenta una forte persistenza intorno al
valore medio, mentre valori che si discostano da questo tendono a presentarsi in
maniera con probabilità progressivamente decrescente all’aumentare della loro
distanza proprio dal valore medio. Andamento tipico della distribuzione normale.
Avendo scelto un simile modello di probabilità, valutare l’altezza media significa
quindi dare un valore alla grandezza µ
quesito b-c)
Un buon stimatore dell’altezza media è dato dalla media campionaria:
X=
1 n
∑ Xi
n i =1
tale scelta è giustificata anzitutto dal principio secondo il quale ha senso utilizzare
come applicando ai dati campionari una funzione che opera su questi la medesima
sintesi che la grandezza incognita opera sull’intera popolazione (quindi stimare
una media di popolazione con una media campionaria, una varianza di
popolazione con varianza campionaria ecc. …).
Inoltre a tale indicazione di principio, in questo caso si possono affiancare
importanti (non secondarie!) caratteristiche più “Tecniche” che caratterizzano la
scelta degli stimatori, e cioè se lo stimatore scelto gode di probabilità
“auspicabili” e se si è in grado di stabilire alcune caratteristiche sulla sua
distribuzione di probabilità, dato che è anch’esso una variabile casuale.
In questo caso lo stimatore risulta corretto! Infatti:
1
1 n
 1  n
 1 n
E ( X ) = E  ∑ X i  = E  ∑ X i  = ∑ E ( X i ) = nµ = µ
n
 n i =1  n  i =1  n i =1
Inoltre, si è in grado di conosce anche la distribuzione dello stimatore, o meglio
una sua trasformazione, che comunque permette di determinare ad esempio la
probabilità con cui tale stimatore restituisce stime che sono comprese in dati
intervalli.
Infatti considerando:
13
Esercizio
considerando la grandezza:
S2 =
è noto che:
quesito d)
14
Il 03 dicembre tra le 10:00 e le 10:10 sono affluite in maniera indipendente presso la
Fiera di Bologna 1000 in occasione della manifestazione “MotorShow”.
1
2
∑ (X i − X )
n − 1 i =1
n
a) Sapendo dalle esperienze degli anni precedenti che il 32% delle persone che
accedono al “MotorShow” la mattina dei giorni scolastici è costituito da
adolescenti che hanno marinato le lezioni, qual è la probabilità che tra le 1000
persone considerate, gli studenti che hanno marinato la scuola è compreso fra
280 e 300?




 X − µ  ~ t n −1
 S 


 n 
b) E’ noto inoltre che la spesa media per gadgets vari è pari a 60 €; dato che per i
1000 individui considerati la varianza campionaria corretta della loro spesa è stato
di 36€, qual è la probabilità che la spesa media delle persone considerate sia
compresa fra 59.5 e 60.5 €?
dai dati ottenuti si ha che:
x=
175 + 171 + 173 + 189 + 188 + 160 + 177 + 188 + 167 + 174 1762
=
= 176.2 cm
10
10
quindi si fornisce come stima di µ:
µˆ = x = 176.2 cm
15
16
 p(1 − p ) 
Pˆ ~ N  p,

n 

Quesito a)
Definendo X come il numero di studenti scolastici che hanno marinato la scuola, questa
è una variabile casuale di tipo binomiale, quindi la probabilità richiesta è data da:
P(280 ≤ X ≤ 300 ) = P( X ≤ 300 ) − P( X ≤ 280 ) =
quindi nel caso considerato si ha che:
300 1000
280 1000




0.32 xi 0.681000− xi − ∑ 
0.32 xi 0.681000− xi
= ∑ 
x
x
i =0 
i =0 
i 
i 
Il calcolo di tale probabilità può essere risolto più agevolmente osservando che la
probabilità richiesta è pari alla probabilitàPche la proporzione di scolari nel campione
sia compreso tra 0.28 e 0.30
X
Pˆ =
n
(
P(280 ≤ X ≤ 300) = P 0.28 ≤ Pˆ ≤ 0.30
per n → ∞
0.32 ⋅ 0.68 

Pˆ ~ N  0.32,

1000 

quindi si ha che la probabilità richiesta è pari a:
(
)
P(280 ≤ X ≤ 300 ) = P 0.28 ≤ Pˆ ≤ 0.30 =


0.28 − 0.32
≤
= P
 0.32 ⋅ 0.68

1000

)
Infatti data la dimensione del campione, si può utilizzare l’approssimazione fornita
dal teorema del Limite centrale, secondo cui si deduce che al divergere della
numerosità campionaria si ha che ~:


0.30 − 0.32 
Pˆ − p
≤
0.32 ⋅ 0.68 
p(1 − p )

1000 
n
17
(
)
P(280 ≤ X ≤ 300 ) = P 0.28 ≤ Pˆ ≤ 0.30 =
18
commento sulla convergenza della binomiale ad una normale. p=0.32
0.02 
 0.04
= P −
≤Z ≤−
=
0.0148 
 0.0148
= P(− 2.70 ≤ Z ≤ −1.35) = P(Z ≤ −1.35) − P(Z ≤ −2.70 )
n=1
P(Z ≤ −1.35) = 1 − P(Z ≤ 1.35) = 1 − 0.91149 = 0.08851
P(Z ≤ −2.70 ) = 1 − P(Z ≤ 2.70 ) = 1 − 0.99653 = 0.00347
P(280 ≤ X ≤ 300 ) = 0.08851 − 0.00347 = 0.08504
n=5
19
20
n=50
n=10
21
22
n=1000
n=100
23
24
quesito b)
0.05 
 0.05
P(59.5 ≤ Y ≤ 60.5) = P −
≤Z≤
 = P(− 2.63 ≤ Z ≤ 2.63) =
0.19 
 0.19
= P(Z ≤ 2.63) − P(Z ≤ −2.63) =
= P(Z ≤ 2.63) − [1 − P(Z ≤ 2.63)] = 2 P(Z ≤ 2.63) − 1 =
= 2 ⋅ 0.99573 − 1 = 1.99 − 1 = 0.99
Definendo la variabile:
Y = testo spesa individuale per gadgets
data la numerosità del campione e la conoscenza della varianza campionaria
corretta, per determinare la probabilità richiesta, relativa alla media della varibile
sopra considerata, può essere determinata sfruttando l’il risultato derivante dal
teorema del Limite centrale:




µ
Y
−

 → N (0,1) per n → ∞
 S 


 n 
si ha quindi:




µ
59
.
5
−
60
Y
−
60
.
5
−
60


P (59.5 ≤ Y ≤ 60.5) = P
≤
≤

S
36
36 


n
1000 
 1000
25
Esercizio
Mario è uno studente della facoltà di medicina dell’università di Bologna; durante
l’esperienza accumulata nel primo anno ha dedotto che la durata del tragitto
quotidiano per raggiungere la sede universitaria da casa sua è ben descritto da una
variabile casuale normale con media 40 min e varianza 49 min2. Considerando anche
che la durata quotidiana del viaggio è indipendente da quella degli altri giorni, qual è
la probabilità che in 7 giorni consecutivi la durata media del suo viaggio sia
compreso fra 39 e 50 min?
X i = durata in minuti del viaggio per raggiunger la facoltà
(
X i ~ N µ ,σ 2
Quindi la probabilità che la durata media del viaggio sia compresa fra 39 e 50 minuti, è data
da:




38 − 40 X − µ 50 − 40 

P (39 ≤ X ≤ 50 ) = P
≤
≤
=
7 
σ
 7


n
7
7 




1
10 
 = P(− 0.38 ≤ Z ≤ 3.79 ) =
= P −
≤Z≤
7
7 



2.65 
 2.65
= P(Z ≤ 3.79 ) − P(Z ≤ −0.38)
Definendo la variabile casuale:
Dal testo si ha che:
26
)
Questo implica che in 7 giorni la durata media del viaggio si distribuisce secondo
P(Z ≤ 3.79 ) = 0.99992

σ2 

X ~ N  µ X ,
n 

P(Z ≤ −0.38) = 1 − P(Z ≤ 0.38) = 1 − 0.64803 = 0.35197
27
28
P (39 ≤ X ≤ 50 ) = 0.99992 − 0.35197 = 0.64795
Esercizio
Marta è una amica di Mario, anche lei iscritta al secondo anno di medicina. Lei
raggiunge in bicicletta la facoltà e durante il primo anno ha dedotto che durata del
tragitto quotidiano per raggiungere la sede universitaria da casa sua è ben descritto
da una variabile casuale normale con media 25 min, ma non ne conosce la varianza.
Considerando anche che la durata quotidiana del viaggio è indipendente da quella
degli altri giorni, qual è la probabilità che negli ultimi 7 giorni consecutivi la durata
media del suo viaggio sia maggiore di 30, sapendo che la varianza corretta della
durata del suo viaggio degli ultimi 7 è stata pari a 25.73 min2?
Definendo in questo caso la variabile casuale:
X i = durata quotidiana in minuti del viaggio per raggiunger la facoltà
e la considerando la media degli ultimi 7 giorni:
X=
la probabilità da determinare è:
29
dalle ipotesi e i dati a disposizione si può sfruttare il risultato seguente:




 X −µ ~t
 S  n −1


 n 
dato che dal testo si ha:
S 2 = 25.73
µ = 25
n=7
segue quindi che:








5
X − µ 30 − 25 


=
≥
= P t6 ≥
P ( X ≥ 30 ) = P
 S
5
.
07247
25.73 






2
.
65


n
7 

= P(t6 ≥ 2.612 ) = 0.02
31
1 n =7
∑ Xi
n i =1
P (X ≥ 30 ) = ?
30