Prova scritta Complementi di Probabilità e Statistica 10 Luglio 2007 1. Nel collaudare un lotto mediante campionamento, si effettuano delle verifiche per classificare in conformi e difettosi gli esemplari del campione prelevato. Si assuma che il lotto sia costituito da N pezzi, di cui D difettosi. Si supponga di effettuare n = 5 ≤ N estrazioni (senza ripetizione) e di accettare il lotto solo se nel campione selezionato si trovano al più d pezzi difettosi. Sia Pa la probabilità che il lotto venga accettato. Fissato d, si D chiama curva operativa del collaudo, la curva che effettua il grafico delle coppie , Pa N D . Riportare su un solo grafico le curve operative al variare della frazione di pezzi difettosi N del collaudo corrispondenti a d = 1,2,3,4,5 (quindi 5 curve), per N = 5000 e frazione di pezzi difettosi che varia da 0 a non oltre il 30%. 2. Su una linea di produzione di barattoli di aranciata dal contenuto nominale di 33cl, sono stati prelevati 20 campioni di 4 barattoli ciascuno, ottenendo le seguenti stime campionarie: 20 ∑ x j = 678.00cl j =1 20 ∑s j =1 2 j = 216.80cl 2 USL − µ µ − LSL , Si valuti la capacità del processo C pk = min nell’ipotesi che i limiti 3σ 3σ prescritti siano pari al valore nominale ± 5%. 3. Il modello di vita dell’apparato propulsivo di un sottomarino atomico ha un tasso di guasto pari a z (t ) = 2t 3 guasti/mese. Determinare l’affidabilità del sistema a 2 mesi. 4. Un esperimento assegna a caso una persona a un tipo di dieta: dieta A (normale), dieta B (cibo pesante) , dieta C (programma alimentare controllato). Dopo 5 settimane, questo è il peso acquisito in grammi: Gruppo A (dieta standard): Gruppo B (dieta pesante): Gruppo C (dieta controllata): 11.8 13.6 9.2 12.0 14.4 9.6 10.7 12.8 8.6 9.1 13.0 8.5 12.1 13.4 9.8 (a) Effettuare una analisi ANOVA completa. (b) Verificare se il campione nella sua interezza può ritenersi gaussiano con un test di ipotesi. • Correzioni martedi’ 17 Luglio 2007, ore 9.30. Soluzioni prova scritta di Complementi di Probabilità e Statistica del 10 Luglio 2007 1. Si tratta di calcolare la probabilità P ( X ≤ d ) per d=1,2,3,4 poiché per d=5 il valore di tale probabilità vale sempre 1. Per calcolare tale probabilità basta utilizzare la funzione DISTRIB.IPERGEOM di Excel, costruire la tavola della massa di probabilità P ( X = x), x = 0,1,2,3,4 per D=5000*p, con p che va da 0.01 a 0.30 con passo 0.01 (o altro passo che si ritiene più appropriato) e poi sommare opportunamente le colonne per determinare P ( X ≤ d ) . Curve di collaudo Prob. accettare 1,1 1 d=1 0,9 d=2 0,8 d=3 0,7 d=4 0,6 0, 28 0, 25 0, 22 0, 19 0, 16 0, 13 0, 10 0, 07 0, 04 0, 01 0,5 % difettosità 2. La media totale sarà data da X = 1 20 ∑ x j = 33,9cl 20 j =1 mentre la varianza campionaria è data 1 20 2 ∑ s j = 10,84. Dai dati del problema si ha che USL = 33(1 + 0.05) = 34,65 20 j =1 mentre LSL = 33(1 − 0.05) = 31,35. Pertanto si ha da S 2 = 34,65 − 33,9 33,9 − 31,35 , C pk = min = min{0,0759;0,0735} = 0,0735. 9,877 9,877 t t 3 t4 3. L’affidabilità del sistema è data da R (t ) = exp − ∫ z ( s )ds = exp − 2∫ s ds = exp − 2 0 0 tratta dunque di calcolare R(2). 4. Si tratta di effettuare un’anova ad un fattore, ossia RIEPILOGO Gruppi Conteggio A 5 B 5 C 5 e Somma 55,7 67,2 45,7 Media Varianza 11,14 1,613 13,44 0,388 9,14 0,338 Si ANALISI VARIANZA Origine della variazione SQ Tra gruppi 46,3 In gruppi 9,356 Totale gdl 55,656 Valore di significatività 2,26E-05 MQ F 2 23,15 29,69218 12 0,779667 F crit 3,88529 14 In base ai dati si rigetta l’ipotesi che i trattamenti abbiano media uguale. Poiché i campioni hanno taglia 5, il box-plot dei dati risulta essere Box-plot 16 14 12 10 8 6 4 2 0 q1 min q2 max q3 1 2 3 Diete Dal box plot, si evince che tutte e tre le coppie di medie dovrebbero essere statisticamente diverse. Per convalidare questa tesi effettuiamo un test di Fisher, ossia A B 2,3 A B C C 2 4,3 Il quantile di riferimento è 1.22 dal quale si evince che le diete sono tutte mediamente diverse. Infine per validare il risultato è necessario effettuare una analisi dei residui, ad esempio mediante l’uso di un Q-Q plot. 1.2 1 0.8 0.6 Serie1 0.4 0.2 0 -3 -2 -1 0 1 2 Dall’uso del Q-Q plot la distribuzione gaussiana risulta dubbia. Pertanto si effettua un Test di KS. Dati Cum.emp. Cum.Teor. Diff. -2.04 0.066667 0.00629 0.060377 -0.64 0.133333 0.216847 0.083513 -0.64 0.2 0.216847 0.016847 -0.54 0.266667 0.254447 0.01222 -0.44 0.333333 0.295207 0.038126 -0.44 0.4 0.295207 0.104793 -0.04 0.466667 0.480487 0.013821 0.06 0.533333 0.529254 0.004079 0.16 0.6 0.577586 0.022414 0.46 0.666667 0.71318 0.046514 0.66 0.733333 0.790268 0.056935 0.66 0.8 0.790268 0.009732 0.86 0.866667 0.853601 0.013065 0.96 0.933333 0.879869 0.053465 0.96 1 0.879869 0.120131 La statistica test vale 0.12 che confrontata con il quantile di riferimento 0.33, fa ritenere gaussiana la distribuzione dei residui. Infine verifichiamo che il campione casuale nella sua interezza ha legge gaussiana. Dati 8.5 8.6 9.1 9.2 9.6 9.8 10.7 11.8 12 12.1 12.8 13 13.4 13.6 14.4 Cum.emp. 0.066667 0.133333 0.2 0.266667 0.333333 0.4 0.466667 0.533333 0.6 0.666667 0.733333 0.8 0.866667 0.933333 1 Cum.teor. 0.084274 0.092315 0.141103 0.152652 0.204936 0.23465 0.393058 0.610801 0.648736 0.667188 0.783456 0.811766 0.861134 0.882175 0.94385 Diff. 0.017607 0.041018 0.058897 0.114015 0.128398 0.16535 0.073608 0.077468 0.048736 0.000521 0.050123 0.011766 0.005533 0.051158 0.05615 La statistica test vale 0.165, che risulta inferiore al quantile 0.33, da cui non si rigetta l’ipotesi di distribuzione gaussiana per il campione.