Prova scritta di Affidabilità dei sistemi e Controllo statistico di qualità 27 Marzo 2011 Tempo di lavoro: 2 ore. Gli esercizi vanno svolti in un file word. Riportare su questo file sia i grafici che eventuali comandi MATLAB impiegati per lo svolgimento degli esercizi. 1. Un campione di 60 valvole a diaframma, usate nel sistema di controllo di un processo chimico, sono sottoposte alla prova di durata (senza sostituzione). I primi 9 insuccessi sono stati osservati dopo 3.6, 6.9, 9.5, 15.7, 27.3, 41.2, 81.7, 178.3 e 227.1 ore. (a) Formulare una ipotesi sul modello “tempo di vita” di questa valvola e sottoporla a verifica. (b) Usando il risultato di cui al punto (a), stimare la probabilità che questo tipo di valvola a diaframma funzioni soddisfacentemente per almeno 150 ore. (c) Stimare il tempo di vita medio. (d) Formulare - ed effettuare - un test di ipotesi per verificare che la media della popolazione da cui il campione è stato estratto è uguale - con un margine di errore del 5% - al tempo di vita medio (teorico) ottenuto dal modello costruito al punto (a). 2. E’ stato realizzato un test per determinare quali tra 3 diversi design della pallina da golf A,B e C diano luogo alla distanza maggiore. Le palline da golf sono state colpite da 3 diversi giocatori professionisti P1 , P2 e P3 utilizzando tre mazze diverse D1 , D2 e D3 . Si è realizzato l’esperimento su tre diversi fairway e le distanze dal tee al punto in cui la palla si arrestava è stata misurata in iarde come segue: Primo fairway Secondo fairway D1 D2 D3 D1 P1 265(B) 311(A) P2 350(A) 284(C) 330(B) P3 258(C) 305(B) 249(C) 220(B) 351(A) 319(A) D2 276(A) D3 D1 189(C) 159(B) 232(C) 264(B) 175(C) 254(B) Terzo fairway 307(A) 262(A) D2 205(A) D3 142(C) 168(C) 246(B) 198(C) 237(B) 283(A) a) Si può affermare che le mazze e le palline influenzino la distanza? b) Se si fosse usata la funzione segnale/rumore del Taguchi, quale combinazione sarebbe stata migliore? 3. Il numero di switches non conformi in campioni di taglia 150 è dato dalla seguente tavola. Costruire una carta di controllo per monitorare il processo. Costruire le regole di zona. n. 1 Dif. 8 2 1 3 3 4 0 5 2 6 4 7 0 8 1 9 10 11 12 13 14 15 16 17 18 19 20 10 6 6 0 4 0 3 1 15 2 3 0 Soluzione esercizio 1. Effettuiamo un normalplot dei dati per stabilire se è lecito formulare una ipotesi di legge gaussiana. Normal Probability Plot 0.95 0.90 0.75 y tli i b a b or P 0.50 0.25 0.10 0.05 0 50 100 150 200 Data Come si evince dal grafico, i dati non si distribuiscono lungo una retta. Pertanto il modello gaussiano non risulta idoneo a descrivere i tempi di vita di questo dispositivo. Costruiamo il weibplot dei dati per stabilire se è lecito formulare una ipotesi di legge di Weibull. Weibull Probability Plot 0.96 0.90 0.75 0.50 y tli i b a b or P 0.25 0.10 0.05 1 2 10 10 Data Il grafico mostra un andamento maggiormente lineare. Effettuiamo lo stesso tipo di grafico anche per il modello esponenziale. In tal caso bisogna effettuare un grafico per i le coppie di punti (xi, log(1/(1-F(xi)), dove la funzione di ripartizione è stata stimata con il metodo Median Rank. Mediante il tool del MATLAB, polytool, si deduce che il modello di Weibull è quello più idoneo, poiché anche nel caso esponenziale l’andamento non è lineare. Per stimare i parametri usiamo la function weibfit, che restituisce i valori assunti dagli stimatori di massima verosimiglianza per un modello di Weibull. I valori calcolati sono: parmhat(1)= 57.3024, parmhat(2)= 0.7955. Poiché i dati sono in numero esiguo per poter effettuare un istogramma, effettuiamo un grafico della funzione di ripartizione empirica vs la funzione di ripartizione teorica, con i parametri stimati al punto precedente. Empirical cdf vs Weibull cdf 1 Empirical Weibull 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 0 50 100 150 200 250 Effettuiamo un test di Kolmogorov-Smirnov. Con una statistica test di 0.1442 e un p-value di 0.9857, non si rigetta l’ipotesi che il campione segua una legge di Weibull. Pertanto per rispondere al quesito (b), usiamo la funzione di affidabilità associata ad un modello di Weibull con i parametri stimati precedentemente, ossia 1-wblcdf(150, parmhat(1), parmhat(2)), che restituisce 0.1165. Per stimare il tempo di vita medio dobbiamo calcolare la media campionaria dei dati, ossia mean(x), che restituisce 65.70. Infine per rispondere all’ultimo quesito, è necessario effettuare un test di ipotesi sulla media. Poiché il campione non è gaussiano, e la taglia è solo 9, non possiamo usare un test classico, ma dobbiamo usare un test non-parametrico. Ad esempio un test sulla mediana. Calcoliamo la mediana della legge di Weibull con i parametri stimati al punto (a) e la confrontiamo con la mediana del campione assegnato, mediante la function ranksum. La mediana della legge di Weibull risulta essere med=36.1483, ottenuta da wblinv(0.5, parmhat(1), parmhat(2)). In tal caso, effettuando un ranksum test ranksum(med,x), ma anche un signtest(x-med), l’ipotesi nulla si rigetta, il che è comprensibile poiché il campione ha una mediana di 27.3000 ben diversa da 36.1483. L’analisi effettuata mostra che il modello caratterizzato è solo in prima approssimazione utilizzabile per descrivere il tempo di vita del dispositivo. Sarebbero necessari maggiori dati per correggere le stime calcolate per i parametri. Soluzione esercizio 2. In primo luogo è necessario costruire la matrice dei dati in modo che sulle colonne appaiano i livelli delle mazze e sulle righe i livelli delle palline. A B C D1 350, 319, 262 265,220,159 258,175,198 D2 311,276,205 305,254,237 284,232,168 D3 351,307,283 330,264,246 249,189,142 Dobbiamo dunque effettuare un ANOVA a due fattori con repliche n=3. Il vettore dei dati è il seguente >> dati=[350, 311, 351; 319,276,307; 262,205,283; 265,305,330; 220,254,264; 159,237,246; 258,284,249; 175,232,189; 198,168,142]; >> spazio=3; >> [p,tbi,stats]=anova2(dati,spazio) Dalla tavola prodotta dal MATLAB, si evince che c’è assenza di interazioni (p-value 0.2902) pertanto è possibile effettuare l’ANOVA sulle colonne (i tipi di mazza) che hanno livelli non statisticamente diversi in media (p-value 0.7451) e l’ANOVA sulle righe, che invece hanno livelli statisticamente diversi in media (p-value 0. 0047). Pertanto i prototipi di pallina influenzano la distanza percorsa. Eseguiamo un multcompare(stats). In questo caso il risultato ci conferma che non vi è differenza sulle colonne. Per effettuare il test sulle righe, bisogna cambiare la matrice dei dati, mettendo le tipologie di palline sulle colonne. Ossia >> dati1 dati1 = 350 319 262 311 276 205 351 307 283 265 220 159 305 254 237 330 264 246 258 175 198 284 232 168 249 189 142 Richiamando multcompare(stats), si scopre che sono statisticamente diverse le palline A e C. Effettuiamo anche i box-plots per righe e per colonne. Per effettuare l’analisi dei residui sul fattore palline, usiamo la matrice dati1. Box-plot per il fattore pallina 350 300 s e ul a V 250 200 150 1 2 Column Number da cui si evince che il tipo A e C sono diversi, 3 Box-plot per il fattore mazza 350 300 s e ul a V 250 200 150 1 2 Column Number 3 mentre effettuando il box-plot per il fattore mazza, si evince che le tre mazze sono simili. Effettuiamo l’analisi dei residui per il fattore palline. Il normplot mostra un andamento lineare. Il test di Kolmogorov-Smirnov kstest(residui1/std(residui1)). non rigetta l’ipotesi di gaussianità dei dati Effettuiamo l’analisi dei residui per il fattore mazza. Il normplot mostra un andamento lineare. Il test di Kolmogorov-Smirnov kstest(residui/std(residui)). non rigetta l’ipotesi di gaussianità dei dati Per rispondere al secondo quesito dell’esercizio, si osservi che qui va impiegato il modello HB, poiché il valore nominale è infinito. In questo caso va calcolata la funzione SN per ogni cella della tabella data all’inizio: A B C D1 49.6446 46.0522 46.1271 D2 48.0261 48.3314 46.5490 D3 49.8278 48.7446 45.0530 Pertanto la combinazione A-D3 è quella da scegliere. Questa scelta è in accordo con i boxplots disegnati: infatti da essi si evince che la pallina A è quella che percorre una distanza maggiore e la mazza D3 è quella il cui box-plot è maggiormente spinto verso l’alto. Soluzione esercizio 3. Si tratta di costruire una carta per attributi di tipo P (o NP). Il limite superiore va posto pari a 0.0597 (da mean(p)+3*sqrt(mean(p)*(1-mean(p))/150)), mentre il limite inferiore va posto pari a 0, poiché mean(p)-3*sqrt(mean(p)*(1-mean(p))/150) è negativo. Il limite centrale invece risulta essere 0.0230. La carta dunque risulta essere della seguente forma Da questa carta si evince che ci sono sicuramente due fuori controllo, in corrispondenza del campione n. 9 e del campione n. 17. Costruiamo le regole di zona (sostituendo al 3, prima il valore 2 e poi il valore 1). Da qui si evince che anche il campione n. 1 si trova in una posizione che richiede maggiore indagine, ed anche i campioni 4, 7, 12 e 14. Per la zona B, i campioni 10 e 11 e i campioni 18 e 19 andrebbero ulteriormente ispezionati. In sostanza, il processo non appare in controllo statistico ed ulteriori indagini andrebbero condotte.