Prova scritta di Statistica 30 Settembre 2013 – Programma Cerasoli 1. Un certo tipo di uva da vino cresce in due regioni distinte A e B che occasionalmente sono infestate da parassiti. Sia A l’evento “la regione A è infestata da parassiti” e sia B l’evento “la regione B è infestata da parassiti”. Siano Se la regione A è infestata da parassiti, qual è la probabilità che sia infestata da parassiti anche la regione B? 2. Sia X una variabile aleatoria geometrica di parametro p. Provare che . 3. Una industria produce anelli per catene. Il laboratorio di ricerca dell’industria modella la lunghezza di un anello con una variabile aleatoria X di media 5 cm e di varianza 0.04 cm. La lunghezza di un anello è definita in maniera tale che la lunghezza della catena è pari alla somma della lunghezza degli anelli. L’azienda vende catene di 50 m. Per sicurezza, ogni catena è costruita con 1002 anelli. L’azienda garantisce che la catena è non più piccola di 50 metri. Se per caso una catena risulta più piccola, la catena viene sostituita gratuitamente. Calcolare la % di catene prodotte dall’azienda con una lunghezza inferiore a 50 m. Se si vuole che questa percentuale sia del 20%, da quanti anelli deve essere composta la catena? 4. Il seguente elenco contiene le temperature in gradi Fahreneit di un motore per una navetta spaziale. Costruire un istogramma con ampiezza delle classi pari a 5. Determinare gli indici di posizione e commentarli anche in relazione all’istogramma così costruito. 66 70 69 68 67 72 73 70 57 63 70 78 67 67 53 67 75 70 81 76 79 75 76 58 Soluzioni 1. Si tratta di calcolare P ( B | A) = P ( AI B ) P ( A) = P ( A ) + P ( B ) − P ( AU B ) P( A) = 3/ 4+2/5−4/5 . 3/ 4 2. Il risultato segue osservando che P ( X ≤ n ) = p + p (1 − p ) + L + p (1 − p )n −1 = p{1 + (1 − p ) + L + (1 − p ) n −1} 1 − (1 − p )n n = p = 1 − (1 − p ) 1 − (1 − p ) 1002 3. La lunghezza di una catena è la v.a. L = ∑ X i dove X i ≈ N ( 5, 0.04 ) Pertanto la i =1 v.a. L è gaussiana di media 50,1m e di varianza 0,408m. La percentuale di catene prodotte dall'azienda con una lunghezza inferiore a 50m risulta essere 50 − 50.1 P ( X ≤ 50 ) = P Z ≤ = P ( Z ≤ −0.0158 ) = 0.4936 . Si tratta di imporre che 0.4008 50 − 0.05 × n = −0.84 = z0.80 . Risolvendo rispetto a n l'equazione 0.0004 × n 0.0025 n 2 - 0.100282 n +2500=0 da cui si ricava n=1011. 4. Il campo di variazione del campione casuale risulta essere 28. Dividendo per 5 classi, l'ampiezza risulta essere 5,6 che si può arrotondare a 6. La tabella delle frequenze assolute risulta essere Classi Freq. 52-58 3 58-64 1 64-70 10 70-76 6 76-82 3 e quindi l'istogramma risulta essere Istogram m a 12 10 8 6 4 2 0 52-58 58-64 64-70 70-76 76-82 Dati Gli indici di posizione sono media 69.56, moda 70 e mediana 70. La distribuzione risulta essere simmetrica rispetto agli indici di posizione, in disaccordo al grafico costruito. Pertanto andrebbe cambiata la ripartizione in classi oppure andrebbe valutato l'indice di simmetria. Prova scritta di Statistica 30 Settembre 2013 – Programma Cristallo/Gallo 1. Campioni di emissioni selezionati da tre fornitori sono classificati in conformità a delle specifiche sulla qualità dell’aria. I risultati su 100 campioni sono dati in tabella: Fornitori 1 2 3 Totale Conformi Si No 22 8 25 5 30 10 77 23 Totale 30 30 40 100 Sia A l’evento “un campione selezionato a caso proviene dal fornitore 1” e sia B l’evento “un campione selezionato a caso soddisfa le specifiche”. Calcolare Stabilire se i due eventi sono indipendenti. Sapendo che il campione estratto proviene dal fornitore 2, qual è la probabilità che non sia conforme alle specifiche? 2. Un produttore farmaceutico asserisce che un particolare farmaco dia un parziale miglioramento dei sintomi di angina pectoris nell'80% dei pazienti. Un medico prescrive questo farmaco a 5 dei suoi pazienti affetti da angina e dopo qualche mese trova che soltanto 2 mostrano un miglioramento dei sintomi. Assumendo che l'affermazione del produttore sia vera, calcolare la probabilità che il medico trovi che 2 o meno pazienti presentano un miglioramento dei sintomi. 3. Vengono intervistati 36 abitanti di una certa città, a cui viene chiesto il numero di vani presente nella propria abitazione. Le 36 risposte ottenute sono le seguenti: 1;3;4;2;2;4;5;5;1;1;2;3;4;3;2;6;6;1;2;2;3;2;1;3;4;2;3;3;3;5;6;4;2;2;4;2: a) Costruire la tavola delle frequenze relative e delle frequenze cumulate. b) Fornire un rappresentazione grafica ”a torta” delle risposte. c) Determinare media, moda, mediana e varianza delle risposte. d) La stessa indagine è stata svolta in una diversa città, e le risposte fornite dal medesimo numero di intervistati hanno dato un valor medio uguale a 2.5 ed una varianza uguale a 3.6. Le due popolazioni hanno la stessa media? Soluzioni 1. P ( AI B ) = P ( A B) = S P ( AI B ) P(B | C) = C AI B P ( B) = AI BC 22 8 C = ; P ( AI B ) = = ; 100 S 100 22 / 100 30 ≠ P( A) = ⇒ A e B non sono indipendenti 77 / 100 100 P (C I B C ) C P( B ) = 5 . 23 2. Si tratta di calcolare P ( X ≤ 2 ) con X binomiale di parametri n=5 e p=0.80.Il valore risulta 0.057. 3. La tabella richiesta risulta essere Modalita' Freq.ass. Freq. Rel. Freq. Cum. 1 5 0,138889 0,138889 2 11 0,305556 0,444444 3 8 0,222222 0,666667 4 6 0,166667 0,833333 5 3 0,083333 0,916667 6 3 0,083333 1 Il grafico a torta ha la forma Grafico a torta 1 2 3 4 5 6 La media e la mediana risultano essere 3, la moda vale 2. La varianza vale 2.17. Per rispondere all’ultimo quesito è necessario effettuare un T-test sulla differenza tra le medie. La statistica test risulta essere Stat = S 2 p X1 − X 2 1 1 S p2 + n1 n2 n1 − 1) S12 + ( n2 − 1) S 22 ( = n1 + n2 − 2 dove = 2.88 Poiché la statistica test ha valore 1.49 che risulta inferiore al quantile t0.025;70 = 1.99 l’ipotesi nulla che le medie sono uguali non si rigetta.