Esercizio 1. Un’azienda che produce carne in scatola ha attivato in due differenti filiali due distinte linee di produzione per la realizzazione del medesimo prodotto. La linea della filiale A ha una produzione giornaliera (in peso lordo) che varia secondo una andamento normale con media 7.5 T e varianza 5.7 T2; la linea della filiale B ha invece una produzione giornaliera che varia secondo una andamento normale con media 6.5 T e varianza 0.75 T2. Università degli Studi di Bologna “Alma Mater Studiorum” Facoltà di Economia – Forlì a) A quanto ammonta la probabilità che la linea della filiale A produca in un giorno una quantità di prodotto compresa fra 4.5 e 4.7 T? e la medesima probabilità per la linea della filiale B? Commenta il risultato. b) Per quale valore della produzione nella della filiale A, la probabilità di avere una produzione maggiore è pari a 0.14457? E per quale valore si ha invece una produzione maggiore con probabilità pari a 0.5? Corso di: c) Qual è la probabilità che le due filiali abbiano una produzione che differisce esattamente di 1 T? Metodi Statistici per L’Economia e per L’Impresa prof.ssa Maria Rosaria Ferrante d) Qual è la probabilità che la linea A abbia rispetto alla linea B, una produzione maggiore per un valore compreso fra 5.9 e 7 T? Esercitazione 6 – 05 Dicembre 2005 Michele Modica e-mail: [email protected] e) Qual è la probabilità che la produzione delle due linee differisca più di 1,5 T? 1 P(Z ≤ −1.26 ) = P(Z ≥ 1.26 ) = 1 − P(Z ≤ 1.26) = 1 − 0.87617 = = 0.10383 Quesito a) definendo: 2 X A = quantità prodotta dalla filiale " A" X = quantità prodotta dalla filiale " B" si ha quindi che: B la probabilità cercata relativamente alla filiale A, è data da: 4.5 − 7.5 X A − µ A 4.7 − 7.5 = P(4.5 ≤ X A ≤ 4.7 ) = P ≤ ≤ 2 5 . 7 5 . 7 σ 3 2.8 = P − ≤Z ≤− = P(− 1.26 ≤ Z ≤ −1.17 ) = 2.39 2.39 = P(Z ≤ −1.17 ) − P(Z ≤ −1.26 ) dato che nelle tavole disponiamo solo delle probabilità cumulate per valori positivi, sfruttando la proprietà di simmetria della normale rispetto alla media, si ha che: P(Z ≤ −1.17 ) = P(Z ≥ 1.17 ) = 1 − P(Z ≤ 1.17 ) = 1 − 0.879 = = 0.121 3 P(4.5 ≤ X A ≤ 4.7 ) = P(− 1.26 ≤ Z ≤ −1.17 ) = 0.121 − 0.10383 = = 0.015992 Per quanto concerne invece la linea B, si ha che 4.5 − 6.5 X − µ 4.7 − 5.5 B P(4.5 ≤ X B ≤ 4.7 ) = P ≤ B ≤ = 2 0.75 0 . 75 σ B 2 1.8 = P − ≤Z ≤− = P(− 2.3 ≤ Z ≤ −2.07 ) = 0.87 0.87 = P(Z ≤ −2.07 ) − P(Z ≤ −2.3) P(Z ≤ −2.3) = P(Z ≥ 2.3) = 1 − P(Z ≤ 2.3) = 1 − 0.98928 = 0.01072 4 P(Z ≤ −2.07 ) = P(Z ≥ 2.07 ) = 1 − P(Z ≤ 2.07 ) = 1 − 0.98077 = = 0.01923 si ha quindi che per la linea B: XB P(4.5 ≤ X B ≤ 4.7 ) = P(− 2.3 ≤ Z ≤ −2.07 ) = 0.01923 − 0.01072 = = 0.00851 commento: in questo caso anche se la distribuzione della linea B è posizionata più vicino all’intervallo considerato rispetto a a quella della linea A (lo si nota ovviamente dal valore della media), ha una probabilità più bassa in relazione al medesimo. Ciò è dovuto al fatto che la prima ha una variabilità molto più contenuta rispetto alla seconda, ciò implica nella XA un addensamento della probabilità maggiore nelle code (e quindi anche nell’intervallo considerato), rispetto a XB, in cui la probabilità si addensa maggiormente nel valore medio. XA 5 quesito b) ~ La quantità di produzione x per la quale si ha una probabilità di 0.14457 di avere A una produzione maggiore, verifica la seguente condizione: P( X A > ~ x A ) = 0.14457 6 segue che il valore cercato è ottenuto come riportato ~ xA − µ A ~ ~ xA − µ A x A − 7. 5 =~ z ⇒ = 1 . 06 ⇒ = 1.06 σ 2 . 39 σ ~ 1.06 = z ~ x A − 7.5 = 1.06 ⋅ 2.39 ⇒ ~ x A = 7.5 + 2.533 = 7.033 che per le “buone” caratteristiche analitiche della distribuzione normale, equivale a: P( X A > ~ x A ) = P( X A ≤ ~ x A ) = 1 − 0.14457 = 0.85543 P( X A > 7.033) = 0.14457 in conclusione: quesiti c-d) standardizzando si ha: x − µA X A − µA ~ ~ P ( X A ≤ x A ) = P ≤ A z ) = 0.85543 = P (Z ≤ ~ σ σ individuando sulle tavole il valore delle probabilità 0.85543, si nota che questo si ha in corrispondenza di: Per risolvere tali quesiti è utile considerare una nuova variabile casuale: Y =X −X A B che rappresenta la differenza di produzione tra la linea A e quella B. E’ noto che tale variabile si distribuisce secondo una normale con media data dalla differenza delle medie delle v.c. e varianza la somma delle rispettive varianze. ( Y ~ N µY , σ Y2 ~ z = 1.06 7 ) µ = µ − µ = 7.5 − 6 = 1 con 2 Y 2 A 2 B σ Y = σ A + σ B = 5.7 + 0.75 = 6.45 8 la risposta al quesito c) è in ogni caso 0, dato che basta osservare che la differenze tra le due produzioni, in ogni caso (cioè sia se si considera XA-XB che XB-XA) è comunque una variabile normale, quindi continua, il che implica che la probabilità che assuma un preciso valore è comunque zero! Più formalmente si può comunque scrivere che: P(Y = 1) = P(− Y = 1) = 0 per il quesito d) per quanto detto sopra, basta determinare, in modo analogo al punto b), la seguente probabilità: 5.9 −1 Y − µ 7 −1 4.9 6 Y P(5.9 ≤ Y ≤ 7) = P ≤ ≤ = P ≤Z ≤ = 2 6.45 2.54 2 . 54 6 . 45 σ Y = P(1.93 ≤ Z ≤ 2.36) = P(Z ≤ 2.36) − P(Z ≤ 1.93) = = 0.99086− 0.97320= 0.0177 9 10 quesito e) Esercizio. Considerare l’evento che le due linee abbiano una produzione che differisce di più di 1.5 T, per le definizioni impostate al punto precedente significa considerare contemporaneamente le due situazioni: Si è interessati a stimare l’altezza media degli studenti della facoltà di Economia; In teoria si potrebbe rilevare la statura di ogni studente, ma essendo la procedura troppo costosa si preferisce estrarre a caso 10 studenti dalla lista degli iscritti e misurarne la statura. A riguardo si è osservato il seguente campione: X A − X B > 1.5 X B − X A > 1.5 da cui segue: (x1 , x2 ,..., x10 ) = (175, 171, 173, 189, 188, 160,177, 188, 167, 174) a) formula adeguate ipotesi sulla popolazione; X A − X B > 1.5 Y > 1.5 ⇒ Y < −1.5 X A − X B < −1.5 b) indica un possibile stimatore della grandezza considerata, giustificando la scelta; c) è possibile affermare qualcosa sulla distribuzione dello stimatore scelto? dunque la probabilità cercata è data da: d) stimare la grandezza di interesse in base al campione considerato. P(Y > 1.5 ∪ Y < −1.5) = P(Y > 1.5) + P(Y < −1.5) Y − µY 1.5 −1 = = 2[1- P(Y < 1.5)] = 21- P < 2.54 σY = 2[1- P(Z < 0.2)] = 2[1 − 0.57926] = 2 ⋅ 0.42074= = 0.841481 11 12 quesito a) In questo caso la popolazione in esame è costituita dalle altezze di individui; l’andamento di tale carattere è ben descritto da una variabile casuale di tipo Normale. Quindi ciascuna altezza può essere considerata come una particolare realizzazione di una variabile aleatoria del tipo: ( xi ~ N µ , σ 2 ) questa scelta è giustificata dal fatto che l’altezza, come del resto la maggior parte dei caratteri di natura antropomorfa, presenta una forte persistenza intorno al valore medio, mentre valori che si discostano da questo tendono a presentarsi in maniera con probabilità progressivamente decrescente all’aumentare della loro distanza proprio dal valore medio. Andamento tipico della distribuzione normale. Avendo scelto un simile modello di probabilità, valutare l’altezza media significa quindi dare un valore alla grandezza µ quesito b-c) Un buon stimatore dell’altezza media è dato dalla media campionaria: X= 1 n ∑ Xi n i =1 tale scelta è giustificata anzitutto dal principio secondo il quale ha senso utilizzare come applicando ai dati campionari una funzione che opera su questi la medesima sintesi che la grandezza incognita opera sull’intera popolazione (quindi stimare una media di popolazione con una media campionaria, una varianza di popolazione con varianza campionaria ecc. …). Inoltre a tale indicazione di principio, in questo caso si possono affiancare importanti (non secondarie!) caratteristiche più “Tecniche” che caratterizzano la scelta degli stimatori, e cioè se lo stimatore scelto gode di probabilità “auspicabili” e se si è in grado di stabilire alcune caratteristiche sulla sua distribuzione di probabilità, dato che è anch’esso una variabile casuale. In questo caso lo stimatore risulta corretto! Infatti: 1 1 n 1 n 1 n E ( X ) = E ∑ X i = E ∑ X i = ∑ E ( X i ) = nµ = µ n n i =1 n i =1 n i =1 Inoltre, si è in grado di conosce anche la distribuzione dello stimatore, o meglio una sua trasformazione, che comunque permette di determinare ad esempio la probabilità con cui tale stimatore restituisce stime che sono comprese in dati intervalli. Infatti considerando: 13 Esercizio considerando la grandezza: S2 = è noto che: quesito d) 14 Il 03 dicembre tra le 10:00 e le 10:10 sono affluite in maniera indipendente presso la Fiera di Bologna 1000 in occasione della manifestazione “MotorShow”. 1 2 ∑ (X i − X ) n − 1 i =1 n a) Sapendo dalle esperienze degli anni precedenti che il 32% delle persone che accedono al “MotorShow” la mattina dei giorni scolastici è costituito da adolescenti che hanno marinato le lezioni, qual è la probabilità che tra le 1000 persone considerate, gli studenti che hanno marinato la scuola è compreso fra 280 e 300? X − µ ~ t n −1 S n b) E’ noto inoltre che la spesa media per gadgets vari è pari a 60 €; dato che per i 1000 individui considerati la varianza campionaria corretta della loro spesa è stato di 36€, qual è la probabilità che la spesa media delle persone considerate sia compresa fra 59.5 e 60.5 €? dai dati ottenuti si ha che: x= 175 + 171 + 173 + 189 + 188 + 160 + 177 + 188 + 167 + 174 1762 = = 176.2 cm 10 10 quindi si fornisce come stima di µ: µˆ = x = 176.2 cm 15 16 p(1 − p ) Pˆ ~ N p, n Quesito a) Definendo X come il numero di studenti scolastici che hanno marinato la scuola, questa è una variabile casuale di tipo binomiale, quindi la probabilità richiesta è data da: P(280 ≤ X ≤ 300 ) = P( X ≤ 300 ) − P( X ≤ 280 ) = quindi nel caso considerato si ha che: 300 1000 280 1000 0.32 xi 0.681000− xi − ∑ 0.32 xi 0.681000− xi = ∑ x x i =0 i =0 i i Il calcolo di tale probabilità può essere risolto più agevolmente osservando che la probabilità richiesta è pari alla probabilitàPche la proporzione di scolari nel campione sia compreso tra 0.28 e 0.30 X Pˆ = n ( P(280 ≤ X ≤ 300) = P 0.28 ≤ Pˆ ≤ 0.30 per n → ∞ 0.32 ⋅ 0.68 Pˆ ~ N 0.32, 1000 quindi si ha che la probabilità richiesta è pari a: ( ) P(280 ≤ X ≤ 300 ) = P 0.28 ≤ Pˆ ≤ 0.30 = 0.28 − 0.32 ≤ = P 0.32 ⋅ 0.68 1000 ) Infatti data la dimensione del campione, si può utilizzare l’approssimazione fornita dal teorema del Limite centrale, secondo cui si deduce che al divergere della numerosità campionaria si ha che ~: 0.30 − 0.32 Pˆ − p ≤ 0.32 ⋅ 0.68 p(1 − p ) 1000 n 17 ( ) P(280 ≤ X ≤ 300 ) = P 0.28 ≤ Pˆ ≤ 0.30 = 18 commento sulla convergenza della binomiale ad una normale. p=0.32 0.02 0.04 = P − ≤Z ≤− = 0.0148 0.0148 = P(− 2.70 ≤ Z ≤ −1.35) = P(Z ≤ −1.35) − P(Z ≤ −2.70 ) n=1 P(Z ≤ −1.35) = 1 − P(Z ≤ 1.35) = 1 − 0.91149 = 0.08851 P(Z ≤ −2.70 ) = 1 − P(Z ≤ 2.70 ) = 1 − 0.99653 = 0.00347 P(280 ≤ X ≤ 300 ) = 0.08851 − 0.00347 = 0.08504 n=5 19 20 n=50 n=10 21 22 n=1000 n=100 23 24 quesito b) 0.05 0.05 P(59.5 ≤ Y ≤ 60.5) = P − ≤Z≤ = P(− 2.63 ≤ Z ≤ 2.63) = 0.19 0.19 = P(Z ≤ 2.63) − P(Z ≤ −2.63) = = P(Z ≤ 2.63) − [1 − P(Z ≤ 2.63)] = 2 P(Z ≤ 2.63) − 1 = = 2 ⋅ 0.99573 − 1 = 1.99 − 1 = 0.99 Definendo la variabile: Y = testo spesa individuale per gadgets data la numerosità del campione e la conoscenza della varianza campionaria corretta, per determinare la probabilità richiesta, relativa alla media della varibile sopra considerata, può essere determinata sfruttando l’il risultato derivante dal teorema del Limite centrale: µ Y − → N (0,1) per n → ∞ S n si ha quindi: µ 59 . 5 − 60 Y − 60 . 5 − 60 P (59.5 ≤ Y ≤ 60.5) = P ≤ ≤ S 36 36 n 1000 1000 25 Esercizio Mario è uno studente della facoltà di medicina dell’università di Bologna; durante l’esperienza accumulata nel primo anno ha dedotto che la durata del tragitto quotidiano per raggiungere la sede universitaria da casa sua è ben descritto da una variabile casuale normale con media 40 min e varianza 49 min2. Considerando anche che la durata quotidiana del viaggio è indipendente da quella degli altri giorni, qual è la probabilità che in 7 giorni consecutivi la durata media del suo viaggio sia compreso fra 39 e 50 min? X i = durata in minuti del viaggio per raggiunger la facoltà ( X i ~ N µ ,σ 2 Quindi la probabilità che la durata media del viaggio sia compresa fra 39 e 50 minuti, è data da: 38 − 40 X − µ 50 − 40 P (39 ≤ X ≤ 50 ) = P ≤ ≤ = 7 σ 7 n 7 7 1 10 = P(− 0.38 ≤ Z ≤ 3.79 ) = = P − ≤Z≤ 7 7 2.65 2.65 = P(Z ≤ 3.79 ) − P(Z ≤ −0.38) Definendo la variabile casuale: Dal testo si ha che: 26 ) Questo implica che in 7 giorni la durata media del viaggio si distribuisce secondo P(Z ≤ 3.79 ) = 0.99992 σ2 X ~ N µ X , n P(Z ≤ −0.38) = 1 − P(Z ≤ 0.38) = 1 − 0.64803 = 0.35197 27 28 P (39 ≤ X ≤ 50 ) = 0.99992 − 0.35197 = 0.64795 Esercizio Marta è una amica di Mario, anche lei iscritta al secondo anno di medicina. Lei raggiunge in bicicletta la facoltà e durante il primo anno ha dedotto che durata del tragitto quotidiano per raggiungere la sede universitaria da casa sua è ben descritto da una variabile casuale normale con media 25 min, ma non ne conosce la varianza. Considerando anche che la durata quotidiana del viaggio è indipendente da quella degli altri giorni, qual è la probabilità che negli ultimi 7 giorni consecutivi la durata media del suo viaggio sia maggiore di 30, sapendo che la varianza corretta della durata del suo viaggio degli ultimi 7 è stata pari a 25.73 min2? Definendo in questo caso la variabile casuale: X i = durata quotidiana in minuti del viaggio per raggiunger la facoltà e la considerando la media degli ultimi 7 giorni: X= la probabilità da determinare è: 29 dalle ipotesi e i dati a disposizione si può sfruttare il risultato seguente: X −µ ~t S n −1 n dato che dal testo si ha: S 2 = 25.73 µ = 25 n=7 segue quindi che: 5 X − µ 30 − 25 = ≥ = P t6 ≥ P ( X ≥ 30 ) = P S 5 . 07247 25.73 2 . 65 n 7 = P(t6 ≥ 2.612 ) = 0.02 31 1 n =7 ∑ Xi n i =1 P (X ≥ 30 ) = ? 30