STATISTICA (I MODULO – INFERENZA STATISTICA) Esercitazione I 27/4/2007 Esercizio A. In una scatola contenente 10 pezzi di un articolo elettronico 2 risultano essere difettosi. Si estraggono a caso due pezzi, uno alla volta senza reimmissione. Quale è la probabilità che: 1. il primo sia difettoso e il secondo sia buono? 2. che il primo sia buono e il secondo difettoso? 3. che uno sia difettoso e l’altro buono? 4. che entrambi siano difettosi? 5. che entrambi siano buoni? Esercizio B. Si supponga di prendere un aereo della compagnia X per andare da Roma a Milano e un aereo della compagnia Y per il viaggio di ritorno. Si definiscano gli eventi A={compagnia X perde il mio bagaglio} e B={compagnia Y perde il mio bagaglio}. Se A e B sono eventi indipendenti con P(A)>P(B), P(A∩B)=0.0002 e P(A∪B)=0.03, determinare P(A) e P(B). Esercizio C. Ad un individuo vengono offerti tre bicchieri di vino (indicati con A, B e C), quindi gli viene chiesto di ordinarli secondo le proprie preferenze. 1. Quali sono gli eventi possibili in questo esperimento e quale probabilità è possibile assegnare a ciascuno di essi sapendo che in realtà i tre bicchieri contenevano lo stesso tipo di vino. 2. Qual è la probabilità che C sia classificato al primo posto della graduatoria? 3. Qual è la probabilità che C sia classificato al primo posto e A all’ultimo posto della graduatoria Esercizio D. In medicina, nell’ambito dei test diagnostici, la probabilità che una persona risulti positiva ad un test quando è effettivamente malata è chiamata sensitività, mentre la probabilità che il test risulti negativo quando non è malata è detta specificità. Si supponga che una persona si sottopone ad un test per la diagnosi di una malattia rara (la frequenza con cui si verifica nella popolazione è pari ad 1 caso ogni 20000 persone); sapendo che il test diagnostico presenta una sensitività pari a 0.99 e una specificità pari a 0.95, qual è la probabilità che la persona sia effettivamente malata qualora il test risulti positivo? Esercizio E. Sei lotti sono pronti per essere consegnati da parte di un certo fornitore. Il numero di componenti difettose in ciascun lotto è il seguente: Lotto Numero di difetti 1 0 2 2 3 0 4 1 5 2 6 0 Si supponga che uno di questi lotti venga fornito ad un determinato cliente, e si definisca la variabile casuale X che esprime il numero di difetti presenti in un lotto. Determinare: 1. la distribuzione di probabilità della variabile casuale X; 2. la funzione di ripartizione della v.c. X; 3. il valore atteso e la varianza della v.c. X. STATISTICA (I MODULO – INFERENZA STATISTICA) Esercitazione II 4/5/2007 Esercizio A. Un’azienda che riceve ordini di acquisto via telefono ha 6 linee telefoniche. Si indichi con X il numero di linee utilizzate in un dato istante di tempo, e si supponga che la distribuzione di probabilità sia la seguente: X 0 1 2 3 4 5 6 f(x) 0.10 0.15 0.20 0.25 0.20 0.06 0.04 Si calcoli la probabilità di ciascuno dei seguenti eventi: 1. al più 3 linee sono in uso; 2. meno di 3 linee sono in uso; 3. almeno 3 linee sono in uso; 4. tra 2 e 5 linee, incluse, sono in uso; 5. tra 2 e 4 linee, incluse, non sono in uso; 6. almeno 4 linee non sono in uso. 7. si calcoli il valore atteso e la varianza della v.c. X. Esercizio B. Un lotto di grandi dimensioni viene consegnato ad un fornitore, il quale, per decidere se accettare o rifiutare il lotto, estrae casualmente con ripetizione 10 pezzi dal lotto ed accetta il lotto se al massimo 1 pezzo risulta difettoso. Si definisca la v.c. X = {numero di pezzi difettosi nel campione}. Assumendo che nel lotto siano presenti un 5% di pezzi difettosi, calcolare: 1. la funzione di probabilità della v.c. X; 3. la probabilità che il lotto sia accettato; 4. valore atteso e varianza del numero di pezzi difettosi; 5. la la probabilità che il lotto venga rifiutato sapendo che nei primi 5 pezzi esaminati non ce n’era nessuno difettoso. Esercizio C. Si supponga che il numero X di tornadi osservati in una determinata regione nell’arco di un anno abbia una distribuzione di Poisson con parametro λ=8. Si calcoli: 1. la probabilità di osservare al più 5 tornadi in una anno; 2. Pr(6≤X≤9); 3. Pr(X≥10); 4. quanti tornadi ci si può attendere di osservare nel prossimo anno e qual è la deviazione standard del numero dei tornadi osservati? Esercizio D. Il tempo di reazione di un automobilista, definito come l’intervallo di tempo che impiega dal momento che si illuminano le luci di frenata di un veicolo che lo precede al momento in cui agisce sui freni, può essere descritto da una v.c. normale con media 1.25 secondi e deviazione standard pari a 0.46 secondi. Si calcoli: 1. la probabilità che il tempo di reazione sia inferiore ad un 1 secondo; 2. la probabilità che il tempo di reazione sia compreso tra 1 e 2 secondi; 3. si consideri il tempo di 2 secondi come il tempo massimo entro il quale è possibile evitare con certezza un incidente. Si determini la probabilità che per un’assicurazione su 100 assicurati più di 5 individui abbiamo un incidente. Esercizio E. Dall’esperienza si ritiene che il diametro dei bulloni prodotti da una fabbrica segua una distribuzione gaussiana. Inoltre, il 25% dei bulloni ha un diametro inferiore a 1.4 mm mentre il 10% ha un diametro maggiore di 1.8 mm. Si determini: 1. il valore atteso del diametro dei bulloni prodotti; 2. una misura dell’inaccuratezza del processo di produzione; 3. la probabilità che il diametro di un bullone prodotto sia inferiore a 1.2 mm; 4. la probabilità che, estraendo a caso 10 bulloni, al massimo 1 di essi abbia lunghezza superiore a 2 mm. STATISTICA (I MODULO – INFERENZA STATISTICA) Esercitazione III 11/5/2007 Esercizio A. Si ritiene, sulla base dell’esperienza passata, che il 10% dei clienti di un supermercato acquistino almeno un prodotto surgelato all’interno della loro spesa. Estratto un campione casuale di 200 clienti del supermercato, calcolare: 1. la probabilità che più di 25 clienti acquistino almeno un prodotto surgelato; 2. la probabilità che il numero dei clienti che acquistano almeno un prodotto surgelato sia compreso tra 10 e 20 clienti. Esercizio B. 2 Si supponga che il tempo di attesa (espresso in minuti) presso un ufficio postale si distribuisca come una v.c. χ con media pari a 5. Si calcoli: 1. la probabilità di attendere più di 10 minuti; 2. la probabilità di attendere un tempo non più lungo del tempo medio; 3. il tempo medio di attesa qualora vi siano 3 individui in fila prima del nostro turno. Esercizio C. Si assuma che per un determinato tipo di lampadine la durata di funzionamento, espressa in giorni, possa considerarsi come 2 una v.c. χ con 20 gradi di libertà. 1. Si calcoli la probabilità che si riesca ad illuminare ininterrottamente una stanza per un periodo di almeno 1 mese. 2. Assumendo di voler illuminare una stanza ininterrottamente, usando una lampadina dopo l’altra, si calcoli la probabilità che con 10 lampadine si riesca ad illuminare tale stanza per un periodo di almeno 6 mesi (suggerimento: si usi il teorema del limite centrale). 3. Si calcoli la probabilità che con 10 lampadine si riesca ad illuminare una stanza ininterrottamente per un periodo compreso tra 160 e 240 giorni. [Suggerimento: si utilizzi il teorema del limite centrale] Esercizio D. Si definisca la v.c. Errore., una combinazione lineare della v.c. X, con E(X)=10 e Var(X)=2, e della v.c. Y, con E(Y)=5, Var(Y)=1.2. Per la v.c. Z si calcoli il valore atteso e la varianza assumendo che le variabili casuali X e Y siano indipendenti. Esercizio E. Si supponga che X 1 ~ N (0,4) , X 4 ~ N (1,9) , Y1 ~ χ 2 (5) e Y2 ~ χ 2 (10) variabili casuali indipendenti. 1. Calcolare P ( X 1 − 2 X 2 > 0) ; 2. Calcolare P( X 12 > 20) ; 3. Trovare il valore q tale che 4. Calcolare X /2 P 1 > 1.5 ; Y /5 1 5. Trovare il valore t tale che 6. Calcolare P( X 12 < q ) = 0.9 ; X /2 P 1 > t = 0.05 ; Y /5 1 Y /5 P 1 > 10 . Y2 / 10 STATISTICA (I MODULO – INFERENZA STATISTICA) Esercitazione IV 18/5/2007 Esercizio A. 3 Il consumo giornaliero di acqua potabile in m di una famiglia italiana può essere descritto da una v.c. normale con media 12 e varianza 9. 1. Calcolare la probabilità che, estraendo un campione casuale di 100 famiglie, il consumo medio sia superiore a 12.6 m3. 2. Se si rimuove l’ipotesi di normalità per la distribuzione del consumo giornaliero di acqua potabile, il risultato calcolato al punto precedente rimane ancora valido? Esercizio B. La concentrazione di metalli pesanti riscontrata nei pesci è spesso utilizzata come misura dell’inquinamento ambientale. Un campione di 12 pesci viene perciò estratto da un lago e la concentrazione di zinco contenuta nel fegato dei pesci misurata (µg/g): X 9.89 10.05 9.01 8.57 9.92 6.84 9.95 8.8 8.79 7.98 9.00 11.46 Assumendo che la variabile X abbia una distribuzione normale, 1. Calcolare una stima della concentrazione media di zinco nel fegato dei pesci del lago. 2. Costruire un intervallo di confidenza al 99% per la concentrazione media di zinco nel fegato dei pesci del lago. 3. Fornire un intervallo di confidenza al 95% per la varianza. 4. Precedenti studi condotti sullo stesso lago avevano messo in evidenza che il valore di σ era pari a 1.71. Calcolare l’intervallo di confidenza del punto 2 alla luce di questa nuova informazione. Esercizio C. Al fine di stimare la quantità media, espressa in litri, del consumo mensile di benzina delle famiglie del comune di Perugia, viene condotta un’indagine su un campione di 213 famiglie ottenendo i seguenti risultati: 213 ∑x i i =1 laddove con 213 = 34293 ∑x 2 = 23583573 i =1 xi si indica il consumo mensile dell’i-esima famiglia,. 1. Utilizzando le opportuni statistiche, stimare il consumo medio mensile di benzina µ delle famiglie e la sua varianza 2. Determinare l’intervallo di confidenza al 95% per µ. 3. Determinare l’intervallo di confidenza al 90% per σ 2 (sugg. supporre che S 2 ha distribuzione χ n2−1 σ2 n −1 ) Esercizio D. Un’azienda acquista laminati da utilizzare nel processo produttivo. A tal fine risulta cruciale lo spessore dei laminati. Calcolare l’errore massimo di stima che si può commettere con probabilità del 99% sulla base di un campione di 100 laminati il cui spessore medio è pari a 1.5 mm con varianza campionaria pari a 0.01. Esercizio E. Un istituto finanziario estrae dal proprio portafoglio clienti un campione causale di 200 individui possessori di carta di credito. Di questi, 23 hanno subito un addebito durante l’anno precedente in seguito a ritardi nei pagamenti. Calcolare un intervallo di confidenza al 90% per la proporzione di clienti che hanno avuto un ritardo nei pagamenti. STATISTICA (I MODULO – INFERENZA STATISTICA) Esercitazione V 25/5/2007 Esercizio A. La seguente distribuzione doppia si riferisce ad un campione di 334 immatricolati in tre Facoltà dell’Ateneo di Perugia: Facoltà Ingegneria Economia Scienze Politiche Totale 1. 2. 3. 4. 5. Voto alla maturità 71-80 81-100 23 59 27 66 20 9 70 134 60-70 23 72 35 130 Totale 105 165 64 334 Nell’ambito degli iscritti alla Facoltà di Economia, si determini un intervallo di confidenza al 99% per il voto medio conseguito alla maturità. Si stabilisca la dimensione che il campione avrebbe dovuto avere per ottenere un errore di stima del voto medio della popolazione inferiore a 3 con probabilità pari a 0.95, supponendo che la varianza sia 91. Si verifichi l’ipotesi che il voto medio alla maturità sia pari a 80 contro l’alternativa che sia maggiore, al livello α=0.1. Si verifichi l’ipotesi che la percentuale di iscritti alla Facoltà di Economia con voto di almeno 81 alla maturità sia pari al 50% contro l’alternativa che sia minore, al livello α=0.05. Si calcoli il livello di significatività osservato per il sistema di ipotesi del punto precedente. Esercizio B. Riprendendo i dati sulla concentrazione di metalli pesanti riscontrata nei pesci (Esercizio B. Esercitazione IV) e supponendo che la distribuzione nella popolazione sia normale, si verifichi l’ipotesi che la media sia pari a 10 µg/g contro l’alternativa che sia diversa, al livello α=0.1 e si costruisca un intervallo di confidenza al 95% per la varianza campionaria. Esercizio C. La seguente tabella riporta la distribuzione di un campione di 242 lavoratori classificati per classi di reddito (in migliaia di euro annui) e tipo di impiego: Lavoratori dipendenti Liberi professionisti Totale 10-20 52 22 74 20-40 58 50 108 40-80 6 54 60 Totale 116 126 242 1. Si verifichi l’ipotesi che la retribuzione media dei lavoratori dipendenti sia pari a 25 mila euro contro l’alternativa che sia inferiore, al livello α=0.01. 2. Relativamente ai lavoratori che guadagnano tra i 20 e i 40 mila euro l’anno, si calcoli un intervallo di confidenza al 95% per la proporzione dei lavoratori dipendenti. 3. Si verifichi l’ipotesi che la proporzione di coloro che guadagnano più di 20 mila euro l’anno sia la stessa tra i liberi professionisti e tra i lavoratori dipendenti, contro l’alternativa che sia maggiore tra i liberi professionisti, ad un livello α=0.01. 4. Si calcoli un intervallo di confidenza al 99% per il reddito medio dei liberi professionisti. 5. Si verifichi l’ipotesi che il reddito medio sia lo stesso per i liberi professionisti e per i lavoratori dipendenti, contro l’alternativa che sia maggiore per i liberi professionisti, ad un livello α=0.05. STATISTICA (II MODULO – INFERENZA STATISTICA) Esercitazione VI 1/6/2007 Esercizio A. La seguente tabella riporta la distribuzione di un campione casuale di aziende di uno stesso settore secondo il consumo di energia (in MW) e fatturato mensile (in migliaia di euro): Consumo di energia 1-5 5-20 20-50 Totale 1-5 38 78 46 162 Fatturato 5-10 2 132 84 218 10-30 0 0 20 20 Totale 40 210 150 400 1. Si verifichi l’ipotesi che il consumo energetico medio delle imprese con fatturato basso (<20) sia lo stesso delle imprese con fatturato alto (>20), contro l’alternativa che il consumo medio sia maggiore nelle imprese con fatturato alto, al livello α=0.05. 2. Si verifichi l’ipotesi che, tra le aziende con fatturato inferiore a 5, il 20% di queste abbia un consumo di energia inferiore a 5, contro l’alternativa che il consumo sia maggiore, al livello α=0.05. 3. In riferimento al sistema di ipotesi del punto precedente, calcolare la potenza per l’ipotesi alternativa che la proporzione sia pari al 25%. 4. Si verifichi l’ipotesi che la proporzione di imprese con fatturato nella classe 5-30 sia lo stesso per le imprese con consumo di energia nella classe 5-20 e nella clase 20-50. Esercizio B. I dati seguenti si riferiscono alla durata (in ore) di un campione di lampadine di due diverse marche: Tipo A Tipo B 3165 3235 3454 3524 3322 3392 3429 3499 3430 3503 3465 3535 3368 3438 Si assuma che la distribuzione della durata di funzionamento sia normale con varianza uguale per le due tipologie. 1. Si verifichi l’ipotesi che la durata media sia la stessa per le lampadine di tipo A e di tipo B contro l’alternativa che sia maggiore per quelle di tipo B, ad un livello α=0.01. 2. Verificare l’ipotesi che la varianza sia pari a 95 contro l’alternativa che sia maggiore, al livello α=0.05. 3. In riferimento al sistema di ipotesi del punto precedente, calcolare la potenza per l’ipotesi alternativa che la varianza sia pari a 105. Esercizio C. Da una indagine condotta presso un istituto di scuola media sono state estratte casualmente 11 studentesse. I dati relativi al peso (in kg) ed altezza (in cm) sono i seguenti: Peso Altezza 46 152 44 160 51 154 48 155 66 167 48 157 62 158 54 161 1. Stimare i parametri della retta di regressione del peso (Y) rispetto all’altezza (X). 2. Calcolare l’intervallo di confidenza al 95% per il coefficiente angolare; 3. Verificare l’ipotesi che la pendenza della retta sia pari a 0, contro l’alternativa che sia positiva, al livello α=0.01. 1. a rispetto alle altre due con a=0.01.