Università degli studi della Tuscia Principi di Statistica dr. Luca Secondi A.A. 2014/2015 Esercitazione di riepilogo Variabili casuali ESERCIZIO 1 Il peso delle compresse di un determinato medicinale si distribuisce secondo una v.c. Normale con media pari a 500 mg e deviazione standard pari a 5 mg. Determinare la probabilità che il peso di una compressa sia: a) Inferiore a 505 mg; b) Compreso tra 492 mg e 506 mg; c) Superiore a 503 mg. Soluzione esercizio n.1 Si definisce la variabile casuale X che descrive il peso delle comprese come X ∼ N ( 500,52 ) Per la determinazione della probabilità che la variabile casuale normale assuma valori in un intervallo si fa riferimento alla funzione di ripartizione della variabile casuale standardizzata Z avente valore atteso nullo e varianza unitaria. La funzione di ripartizione della v.c. Normale standardizzata Z, tabulata per valori di z non negativi, si indica con: Φ( z) = P(Z ≤ z) Procediamo innanzitutto alla standardizzazione del peso delle compresse per ricondurlo ad una distribuzione normale standardizzata. Se infatti X ∼ N ( 500,52 ) , si avrà: Z= X − 500 ∼ N ( 0,1) 5 1 a) Per determinare la probabilità che una compressa abbia un peso inferiore a 505 mg, P ( X < 505) , procediamo innanzitutto alla determinazione del valore z corrispondente: Z= 505 − 500 =1 5 Si avrà quindi: 505 − 500 P ( X < 505 ) = P Z < = P ( Z < 1) = Φ (1) = 0.8413 5 b) La probabilità che il peso di una compressa sia compreso tra 492 e 506 mg si ottiene: 506 − 500 492 − 500 P ( 492 ≤ X ≤ 506 ) = P ≤Z≤ = Φ (1.2 ) − Φ ( −1.6 ) 5 5 =Φ (1.2 ) − 1 − Φ (1.6 ) = 0.8849 − [1 − 0.9452] = 0.8301 2 c) La probabilità di ottenere una compressa con peso superiore a 503 mg è pari a: 503 − 500 P ( X ≥ 503) = P Z ≥ = P ( Z ≥ 0.6 ) = 1 − P ( Z ≤ 0.6 ) = 1 − Φ ( 0.6 ) = 1 − 0.7257 = 0.2743 5 3 ESERCIZIO 2 L’assunzione giornaliera di calcio in una determinata popolazione si distribuisce normalmente con media pari a 485 mg e varianza pari a 102. Determinare: a) La probabilità che un individuo appartenente alla popolazione assuma giornalmente una quantità di calcio superiore a 500 mg; b) La probabilità che un individuo appartenente alla popolazione assuma giornalmente una quantità di calcio tra 480 e 502 mg. Soluzione Esercizio n.2 a) La probabilità che un individuo assuma una quantità giornaliera superiore a 500 mg si determina come: 500-485 P (X> 500) =P Z > = P ( Z >1,5) = 1 − P ( Z <1,5)=1-0,93319=0,06681 10 b) La probabilità che un individuo assuma una quantità giornaliera compresa tra 480 e 502 mg si determina come segue: 502 − 485 480 − 485 P (480 ≤ X ≤ 502) = Φ −Φ 10 10 = Φ (1, 7) − [1 − Φ (0, 5)] = 0,95543 − 0, 30854 = 0, 647 4 ESERCIZIO 3 (Monti 10.10) In un’indagine sul reddito familiare mensile è stato osservato che il reddito dei mariti ha una distribuzione normale con media 1500 euro e scarto quadratico medio 250, mentre il reddito delle mogli si distribuisce indipendentemente in modo normale con media 1200 euro e scarto quadratico medio 300. Si vuole calcolare la probabilità che il reddito familiare superi i 3000 Euro. Soluzione esercizio 3 Si definisce con X 1 ∼ N (1500, 2502 ) la variabile casuale che descrive il reddito dei mariti e con X 2 ∼ N (1200,3002 ) la variabile casuale che descrive il reddito delle mogli. 2 Il reddito familiare è dato da Y = ∑ X i = X 1 + X 2 che rappresenta una i =1 combinazione lineare di v.c. normali (in cui il parametro a1=a2=1). Poiché X1 ed X2 sono indipendenti, la loro somma ha ancora una distribuzione Normale con valore atteso dato dalla somma dei valori attesi delle due variabili casuali: E (Y ) = E ( X 1 ) + E ( X 2 ) = 1500 + 1200 = 2700 e varianza Var (Y ) = Var ( X 1 ) + Var ( X 2 ) = 3002 + 2502 = 152500 da cui si ha: Y1 ∼ N ( 2700,152500 ) La probabilità di ottenere un reddito familiare superiore a 3000 Euro si ottiene come: 3000-2700 P (Y> 3000) =P Z > = P ( Z >0.77) = 1 − P ( Z <0.77)=1-0.7794=0.2206 152500 5 ESERCIZIO 4 I punteggi (in centesimi) ottenuti in un test attitudinale scientifico da un insieme di studenti si distribuiscono normalmente con media pari a 70 e deviazione standard pari a 20. a) Determinare la probabilità che il punteggio conseguito sia compreso tra 80 e 90 b) Determinare il valore soglia per il 20% degli studenti migliori; Soluzione Esercizio 4 Definiamo con X la v.c. che esprime i punteggi conseguiti al test attitudinale, X ∼ N ( 70, 202 ) : a) La probabilità che il punteggio conseguito al test sia compreso tra 80 e 90 si ottiene come segue: 90 − 70 80 − 70 P ( 80 ≤ X ≤ 90 ) = P ≤Z≤ = Φ (1) − Φ ( 0.5 ) = 0.8413 − 0.6915 = 0.1498 20 20 b) Andare a determinare il valore soglia per il 20% degli studenti migliori equivale ad affermare che la probabilità di ottenere punteggi superiore al punteggio soglia (per noi incognito) dovrà essere pari a 0.20 e, pertanto, la probabilità di ottenere punteggi minori (e quindi l’area sottesa alla distribuzione normale fino al valore soglia incognito) pari a 0.80. In questo caso si considera il problema inverso ossia la determinazione del valore di z a cui corrisponde un livello assegnato p della funzione di ripartizione. 6 E’ necessario innanzitutto andare a trovare nella tavola della distribuzione normale standard il valore z che soddisfi la seguente condizione: P ( Z < z ) = Φ ( z ) = 0.80 Dobbiamo quindi guardare all’interno della tavola della distribuzione normale standard per trovare un’area (ovvero una probabilità) pari a 0.80. Dalla tavola si nota che il valore cercato si ottiene in corrispondenza del valore z pari a 0.84 (infatti al valore z=0.84 che si trova incrociando la riga 0.8 e la colonna 0.04 corrisponde una probabilità pari a 0.7995 che rappresenta la probabilità più vicina a 0.80). Il valore z=0.84 “rappresenta” l’80-esimo percentile poiché l’area sottesa alla curva normale fino a quel punto è approssimativamente pari a 0.80. Una volta trovato il valore di Z corrispondente alla probabilità data, per determinare il valore di X corrispondente si ricorre alla formula della standardizzazione: X −µ ⇔ X = µ + zσ σ dove con z0.80 è indicato l’80-esimo percentile della distribuzione normale standard. Si avrà quindi: z0.80 = 0.84 = X − 70 ⇔ X = 70 + 20 ⋅ 0.84 = 86.8 20 Si conclude quindi che il 20% degli studenti ottiene punteggi superiori a 86.8. 7 ESERCIZIO 5 L’altezza media di una popolazione di una popolazione di individui, con distribuzione normale, è di 170 cm con deviazione standard (scarto quadratico medio) di 10 cm. a) Determinare la probabilità che l’altezza sia compresa tra 165 e 180 cm b) Determinare il 90-esimo percentile della distribuzione dell’altezza Soluzione Esercizio 5 a) La determinazione della probabilità che l’altezza sia compresa tra 165 e 180 cm avviene come segue: 180 − 170 165 − 170 P (165 ≤ X ≤ 180 ) = P ≤Z ≤ = Φ (1) − Φ ( −0.5 ) = Φ (1) − 1 − Φ ( 0.5 ) 10 10 = 0.8413 − [1 − 0.6915] = 0.5328 b) Si tratta di un problema inverso consistente nella determinazione del valore di z a cui corrisponde un livello assegnato p, della funzione di ripartizione: P ( Z < z ) = Φ ( z ) = 0.90 Come si nota dalla figura riportata di seguito, si tratta di trovare il punto sull’asse delle ascisse per cui l’area sottesa alla curva della distribuzione normale standard fino a quel punto sia pari al valore assegnato p=0.90. Il valore di z – che chiamiamo z0.90 – rappresenta il 90-esimo percentile (in generale il quantile di livello p) della variabile casuale normale standardizzata. 8 Andando a ricercare all’interno della tavola della funzione di ripartizione della v.c. normale standardizzata, dobbiamo ricercare il valore più prossimo a p=0.9 (e quindi un’area sottesa alla curva pari a 0.9). Dalla tavola si nota che il valore cercato si ottiene in corrispondenza del valore z pari a 1.28 (infatti il valore 0.8997 si trova incrociando la riga 1.2 e la colonna 0.08). Il valore z=1.28 rappresenta il 90-esimo percentile poiché l’area sottesa alla curva normale fino a quel punto è pari a 0.90. Una volta trovato il valore di Z corrispondente alla probabilità data, per determinare il valore di X corrispondente si ricorre alla formula della standardizzazione: X −µ ⇔ X = µ + zσ σ dove con z0.90 è indicato il 90-esimo percentile della distribuzione normale standard. Si avrà quindi: z0.90 = 1.28 = X − 170 ⇔ X = 170 + 10 ⋅1.28 = 182.8 10 Si conclude che il 90-esimo percentile della distribuzione dell’altezza è quindi pari a 182.8. 9 ESERCIZIO 6 Il numero di clienti serviti da un distributore di benzina in 10 minuti può essere considerato come una variabile di Poisson con media uguale a 3. Determinare: a) la probabilità che in dieci minuti vengano serviti esattamente 5 clienti; b) la probabilità che in dieci minuti vengano serviti più di 2 clienti Soluzione esercizio 6 Si fa riferimento allo schema di Poisson che, nel caso specifico dell’esercizio, descrive il numero di clienti serviti in un distributore di benzina. Sia X la variabile casuale che descrive il numero di clienti serviti in un distributore di benzina in 10 minuti. Il valore atteso della v.c. è pari a λ=3 e pertanto X ∼ P ( 3) . a) La probabilità che in dieci minuti vengano serviti 5 clienti si ottiene come segue: P ( X = x) = e−λ λ x x! P ( X = 5) = e−3 35 = 0.10 5! La probabilità che in dieci minuti vengano serviti 5 clienti è pari a 0,10. b) La probabilità che in dieci minuti vengano serviti più di 2 clienti è uguale a 0,577 P ( X > 2 ) = 1 − P ( X ≤ 2 ) = 1 − P ( X = 0 ) + P ( X = 1) + P ( X = 2 ) Si avrà: e−3 30 = 0.0498 0! e−3 31 P ( X = 1) = = 0.149 1! e−3 32 P ( X = 2) = = 0.224 2! P ( X = 0) = Per cui: 10 P ( X > 2 ) = 1 − P ( X ≤ 2 ) = 1 − [ 0.0498 + 0.149 + 0.224] = 0.5772 La probabilità che in dieci minuti vengano serviti più di 2 clienti è pari a 0.5772. 11 ESERCIZIO 7 Un’azienda produttrice di auricolari per telefoni cellulari effettua un controllo di conformità su una partita di pezzi prodotti in una determinata settimana lavorativa estraendo un campione di 10 prodotti. Sulla base dell’esperienza passata si ritiene che la probabilità di avere un pezzo difettoso è pari a 0.15. Determinare: a) la probabilità che 2 pezzi siano difettosi. b) la probabilità che nessun pezzo sia difettoso; c) la probabilità che al massimo 2 pezzi siano difettosi Soluzione esercizio n.7 Lo schema proposto fa riferimento ad un esperimento bernoulliano con risultato dicotomico del tipo “successo” o “insuccesso” dove, nello specifico caso, si identifica l’evento successo con l’identificazione di un pezzo difettoso la scelta con un meccanismo casuale di n pezzi usciti dal processo produttivo sottoposti ad un controllo di conformità ed il conteggio di quelli difettosi dà origine ad una v.c. binomiale. Si tratta infatti di n=10 prove indipendenti ciascuna con probabilità di successo costante pari a π=0.15. Si può scrivere quindi X ∼ Bin (10, 0.15) la cui funzione di massa di probabilità, nella formulazione generale è la seguente: n n! n−x n− x P ( X = x ) = π x (1 − π ) = π x (1 − π ) x !( n − x ) ! x a) La probabilità che esattamente due pezzi siano difettosi si ottiene come segue: 10 10! 10 − 2 10 − 2 P ( X = 2 ) = 0.152 (1 − 0.15 ) = 0.152 (1 − 0.15 ) = 0.276 2!(10 − 2 ) ! 2 b) Andare a calcolare la probabilità che nessuno pezzo sia difettoso sui 10 prodotti estratti per il controllo di conformità sta a significare considerare un numero di successi x=0. La probabilità si ottiene quindi come segue: 10 10! 10 − 0 10 − 0 P ( X = 0 ) = 0.150 (1 − 0.15 ) = 0.150 (1 − 0.15 ) = 0.8510 = 0.197 0!(10 − 0 ) ! 0 c) Per determinare la probabilità che al massimo due pezzi siano difettosi occorre fare riferimento ad una probabilità cumulata (e quindi riferirsi alla funzione di ripartizione). Infatti traducendo 12 l’affermazione “al massimo due pezzi difettosi” in termini probabilistici significa andare a determinare la seguente probabilità: P ( X ≤ 2 ) = P ( X = 0 ) + P ( X = 1) + P ( X = 2 ) Dall’osservazione grafica della funzione di massa di probabilità si accerta quali probabilità occorre considerare per ottenere “la probabilità che vi siano al massimo due pezzi difettosi”: 0.00 0.05 0.10 0.15 p(x) 0.20 0.25 0.30 0.35 X ∼ Bin (10, 0.015) 0 2 4 6 8 10 x Avendo già determinato P ( X = 0 ) e P ( X = 2 ) occorre ora determinare P ( X = 1) : 10 10! 10 −1 10 −1 P ( X = 1) = 0.151 (1 − 0.15 ) = 0.151 (1 − 0.15 ) = 10 ⋅ 0.15 ⋅ 0.159 = 0.347 1!(10 − 1) ! 1 Si avrà quindi: P ( X ≤ 2 ) = P ( X = 0 ) + P ( X = 1) + P ( X = 2 ) = 0.197 + 0.347 + 0.276 = 0.82 13 ESERCIZIO 8 Si consideri l’evento “estrazione di una carta di denari” da un mazzo di carte piacentine composto da 40 carte, fra le quali vi sono dieci carte di denari. Effettuando estrazioni con ripetizione (ossia rimettendo ogni volta la carta estratta nel mazzo e mescolando): è più probabile ottenere una carta di denari in due estrazioni o ottenerne 2 in 4 estrazioni? Soluzione Esercizio n.8 L’esperimento proposto fa riferimento allo schema binomiale dal momento che si propongono un insieme n di prove (ciascuna indipendente dall’altra) per ognuna delle quali si ha una probabilità costante di successo pari a π = 10 1 = = 0.25 40 4 Andando a considerare il primo caso, ovvero la probabilità di ottenere una carta di denari in due estrazioni, si fa riferimento alla probabilità di ottenere x=1 successi in n=2 prove, conoscendo la probabilità di 1 4 successo π = . Si avrà: 1 2 2! 2 −1 1 P ( X = 1) = 0.251 (1 − 0.25 ) = ⋅ 1!( 2 − 1) ! 4 1 1 1 − 4 2 −1 1 3 = 2 ⋅ ⋅ = 0.375 4 4 Nel secondo caso, la probabilità di ottenere x=2 successi in n=4 prove, si ottiene come segue: . 4 1 P ( X = 2) = 2 4 2 1 1 − 4 4− 2 = 4! 1 ⋅ 2!( 4 − 2 ) ! 4 2 1 1 − 4 4−2 1 = 2⋅ 4 2 2 3 ⋅ = 0.2109 4 Si può, quindi, concludere che è più probabile ottenere 1 successo in 2 prove, ossia ottenere una carta di denari in due estrazioni. 14 ESERCIZIO 9 (Monti 9.4) Una società di esplorazione di gas naturale scopre in media quattro giacimenti di gas per ogni 100 trivellazioni eseguite. L’esito di ciascuna trivellazione è indipendente dagli altri. Si eseguono venti trivellazioni. a) Qual b) Qual c) Qual d) Qual è è è è la probabilità che si scopra un giacimento? la probabilità che si scopra al massimo un giacimento? la probabilità che si scoprano almeno due giacimenti? il numero medio di giacimenti scoperti in venti trivellazioni? Soluzione esercizio 9 Si fa riferimento allo schema binomiale in cui n=20 prove (trivellazioni eseguite) mentre la probabilità di successo, che in questo caso equivale alla probabilità di scoprire giacimenti di gas, è pari a π=0.04 a) La probabilità di scoprire un giacimento (x=1) si ottiene come: 20 20! 20 −1 20 −1 P ( X = 1) = 0.041 (1 − 0.04 ) = ⋅ 0.041 ( 0.96 ) = 0.368 1!( 20 − 1) ! 1 b) La probabilità di scoprire al massimo un giacimento si può determinare come segue: P ( X ≤ 1) = P( X = 0) + P ( X = 1) Già si conosce dal punto a) la probabilità di scoprire esattamente un giacimento, occorre determinare la probabilità di non scoprire alcun giacimento (x=0). Si avrà: 20 20! 20 − 0 20 P ( X = 0 ) = 0.040 (1 − 0.04 ) = ⋅ 0.040 ( 0.96 ) = 0.442 0!( 20 − 0 ) ! 0 Si ottiene quindi: P ( X ≤ 1) = P ( X = 0 ) + P ( X = 1) = 0.442 + 0.368 = 0.81 c) La probabilità di scoprire almeno due giacimenti significa considerare la probabilità di ottenere due, tre, quattro,…, venti giacimenti. Dobbiamo quindi determinare la seguente probabilità: P ( X ≥ 2 ) = P ( X = 2 ) + P ( X = 3) + ... + P ( X = 20 ) Allo stesso modo è P ( X ≥ 2 ) come segue: possibile scrivere 15 la probabilità dell’evento P ( X ≥ 2 ) = 1 − P ( X ≤ 1) = 1 − P ( X = 0 ) + P ( X = 1) = 1 − 0.81 = 0.19 d) Per la determinazione del numero medio di giacimenti occorre ricordare in generale che, nel caso di una distribuzione binomiale il valore atteso è pari a: E ( X ) = nπ Con riferimento alla distribuzione binomiale presa in considerazione nell’esercizio X ∼ Bin ( 20, 0.04 ) si avrà: E ( X ) = nπ = 20 ⋅ 0.04 = 0.8 16 ESERCIZIO 10 La probabilità che una ricevuta fiscale emessa da un determinato esercizio commerciale sia errata è pari a 0.35. Sapendo che in una giornata sono state emesse 8 ricevute, determinare: a) La probabilità che ci siano tre o più (almeno tre) ricevute errate; b) Valore atteso e varianza della variabile casuale Soluzione esercizio n.10 Facendo riferimento allo schema binomiale, si definisce la variabile casuale X ∼ Bin (8, 0.35 ) : a) La probabilità di avere tre o più fatture errate (almeno 3) si determina come: P ( X ≥ 3) = P ( X = 3) + P ( X = 4 ) + P ( X = 5 ) + P ( X = 6 ) + P ( X = 7 ) + P ( X = 8 ) = 1 − P ( X ≤ 2 ) = 1 − P ( X = 0 ) + P ( X = 1) + P ( X = 2) Si ottiene quindi: 8 8! 8− 0 8 P ( X = 0 ) = 0.350 (1 − 0.35 ) = ⋅ 0.350 ( 0.65 ) = 0.032 0!( 8 − 0 ) ! 0 8 8! 8−1 7 ⋅ 0.351 ( 0.65 ) = 0.137 P ( X = 1) = 0.351 (1 − 0.35 ) = 1!( 8 − 1) ! 1 8 8! 8− 2 6 P ( X = 2 ) = 0.352 (1 − 0.35 ) = ⋅ 0.352 ( 0.65 ) = 0.259 2!( 8 − 2 ) ! 2 Si avrà quindi: P ( X ≥ 3) = 1 − P ( X = 0 ) + P ( X = 1) + P ( X = 2) = 1 − [ 0.032 + 0.137 + 0.259] = 1 − 0.428 = 0.572 b) La determinazione del valore atteso e della varianza della v.c. avviene come segue: E ( X ) = nπ = 8 ⋅ 0.35 = 2.8 Var ( X ) = nπ (1 − π ) = 20 ⋅ ( 0.04 ⋅ 0.96 ) = 0.768 17