Prova scritta di Affidabilità dei sistemi e Controllo statistico di qualità
27 Marzo 2011
Tempo di lavoro: 2 ore. Gli esercizi vanno svolti in un file word. Riportare su questo file sia i
grafici che eventuali comandi MATLAB impiegati per lo svolgimento degli esercizi.
1. Un campione di 60 valvole a diaframma, usate nel sistema di controllo di un
processo chimico, sono sottoposte alla prova di durata (senza sostituzione). I primi 9
insuccessi sono stati osservati dopo 3.6, 6.9, 9.5, 15.7, 27.3, 41.2, 81.7, 178.3 e 227.1
ore.
(a) Formulare una ipotesi sul modello “tempo di vita” di questa valvola e sottoporla
a verifica.
(b) Usando il risultato di cui al punto (a), stimare la probabilità che questo tipo di
valvola a diaframma funzioni soddisfacentemente per almeno 150 ore.
(c) Stimare il tempo di vita medio.
(d) Formulare - ed effettuare - un test di ipotesi per verificare che la media della
popolazione da cui il campione è stato estratto è uguale - con un margine di
errore del 5% - al tempo di vita medio (teorico) ottenuto dal modello costruito al
punto (a).
2. E’ stato realizzato un test per determinare quali tra 3 diversi design della pallina da
golf A,B e C diano luogo alla distanza maggiore. Le palline da golf sono state
colpite da 3 diversi giocatori professionisti P1 , P2 e P3 utilizzando tre mazze diverse
D1 , D2 e D3 . Si è realizzato l’esperimento su tre diversi fairway e le distanze dal tee al
punto in cui la palla si arrestava è stata misurata in iarde come segue:
Primo fairway
Secondo fairway
D1
D2
D3
D1
P1
265(B)
311(A)
P2
350(A)
284(C) 330(B)
P3
258(C) 305(B)
249(C) 220(B)
351(A)
319(A)
D2
276(A)
D3
D1
189(C) 159(B)
232(C) 264(B)
175(C) 254(B)
Terzo fairway
307(A)
262(A)
D2
205(A)
D3
142(C)
168(C) 246(B)
198(C) 237(B)
283(A)
a) Si può affermare che le mazze e le palline influenzino la distanza?
b) Se si fosse usata la funzione segnale/rumore del Taguchi, quale combinazione
sarebbe stata migliore?
3. Il numero di switches non conformi in campioni di taglia 150 è dato dalla seguente
tavola. Costruire una carta di controllo per monitorare il processo. Costruire le
regole di zona.
n.
1
Dif. 8
2
1
3
3
4
0
5
2
6
4
7
0
8
1
9 10 11 12 13 14 15 16 17 18 19 20
10 6 6 0 4 0 3 1 15 2 3 0
Soluzione esercizio 1.
Effettuiamo un normalplot dei dati per stabilire se è lecito formulare una ipotesi di legge
gaussiana.
Normal Probability Plot
0.95
0.90
0.75
y
tli
i
b
a
b
or
P
0.50
0.25
0.10
0.05
0
50
100
150
200
Data
Come si evince dal grafico, i dati non si distribuiscono lungo una retta. Pertanto il modello
gaussiano non risulta idoneo a descrivere i tempi di vita di questo dispositivo.
Costruiamo il weibplot dei dati per stabilire se è lecito formulare una ipotesi di legge di
Weibull.
Weibull Probability Plot
0.96
0.90
0.75
0.50
y
tli
i
b
a
b
or
P
0.25
0.10
0.05
1
2
10
10
Data
Il grafico mostra un andamento maggiormente lineare. Effettuiamo lo stesso tipo di
grafico anche per il modello esponenziale. In tal caso bisogna effettuare un grafico per i le
coppie di punti (xi, log(1/(1-F(xi)), dove la funzione di ripartizione è stata stimata con il
metodo Median Rank. Mediante il tool del MATLAB, polytool, si deduce che il modello di
Weibull è quello più idoneo, poiché anche nel caso esponenziale l’andamento non è
lineare.
Per stimare i parametri usiamo la function weibfit, che restituisce i valori assunti dagli
stimatori di massima verosimiglianza per un modello di Weibull.
I valori calcolati sono: parmhat(1)= 57.3024, parmhat(2)= 0.7955.
Poiché i dati sono in numero esiguo per poter effettuare un istogramma, effettuiamo un
grafico della funzione di ripartizione empirica vs la funzione di ripartizione teorica, con i
parametri stimati al punto precedente.
Empirical cdf vs Weibull cdf
1
Empirical
Weibull
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
50
100
150
200
250
Effettuiamo un test di Kolmogorov-Smirnov.
Con una statistica test di 0.1442 e un p-value di 0.9857, non si rigetta l’ipotesi che il
campione segua una legge di Weibull.
Pertanto per rispondere al quesito (b), usiamo la funzione di affidabilità associata ad un
modello di Weibull con i parametri stimati precedentemente, ossia 1-wblcdf(150,
parmhat(1), parmhat(2)), che restituisce 0.1165.
Per stimare il tempo di vita medio dobbiamo calcolare la media campionaria dei dati, ossia
mean(x), che restituisce 65.70.
Infine per rispondere all’ultimo quesito, è necessario effettuare un test di ipotesi sulla
media. Poiché il campione non è gaussiano, e la taglia è solo 9, non possiamo usare un test
classico, ma dobbiamo usare un test non-parametrico. Ad esempio un test sulla mediana.
Calcoliamo la mediana della legge di Weibull con i parametri stimati al punto (a) e la
confrontiamo con la mediana del campione assegnato, mediante la function ranksum. La
mediana della legge di Weibull risulta essere med=36.1483, ottenuta da wblinv(0.5,
parmhat(1), parmhat(2)). In tal caso, effettuando un ranksum test ranksum(med,x), ma anche
un signtest(x-med), l’ipotesi nulla si rigetta, il che è comprensibile poiché il campione ha
una mediana di 27.3000 ben diversa da 36.1483.
L’analisi effettuata mostra che il modello caratterizzato è solo in prima approssimazione
utilizzabile per descrivere il tempo di vita del dispositivo. Sarebbero necessari maggiori
dati per correggere le stime calcolate per i parametri.
Soluzione esercizio 2.
In primo luogo è necessario costruire la matrice dei dati in modo che sulle colonne
appaiano i livelli delle mazze e sulle righe i livelli delle palline.
A
B
C
D1
350, 319, 262
265,220,159
258,175,198
D2
311,276,205
305,254,237
284,232,168
D3
351,307,283
330,264,246
249,189,142
Dobbiamo dunque effettuare un ANOVA a due fattori con repliche n=3. Il vettore dei dati
è il seguente
>> dati=[350, 311, 351;
319,276,307;
262,205,283;
265,305,330;
220,254,264;
159,237,246;
258,284,249;
175,232,189;
198,168,142];
>> spazio=3;
>> [p,tbi,stats]=anova2(dati,spazio)
Dalla tavola prodotta dal MATLAB, si evince che c’è assenza di interazioni (p-value
0.2902) pertanto è possibile effettuare l’ANOVA sulle colonne (i tipi di mazza) che hanno
livelli non statisticamente diversi in media (p-value 0.7451) e l’ANOVA sulle righe, che
invece hanno livelli statisticamente diversi in media (p-value 0. 0047). Pertanto i prototipi
di pallina influenzano la distanza percorsa. Eseguiamo un multcompare(stats). In questo
caso il risultato ci conferma che non vi è differenza sulle colonne. Per effettuare il test sulle
righe, bisogna cambiare la matrice dei dati, mettendo le tipologie di palline sulle colonne.
Ossia
>> dati1
dati1 =
350
319
262
311
276
205
351
307
283
265
220
159
305
254
237
330
264
246
258
175
198
284
232
168
249
189
142
Richiamando multcompare(stats), si scopre che sono statisticamente diverse le palline A e C.
Effettuiamo anche i box-plots per righe e per colonne. Per effettuare l’analisi dei residui
sul fattore palline, usiamo la matrice dati1.
Box-plot per il fattore pallina
350
300
s
e
ul
a
V
250
200
150
1
2
Column Number
da cui si evince che il tipo A e C sono diversi,
3
Box-plot per il fattore mazza
350
300
s
e
ul
a
V
250
200
150
1
2
Column Number
3
mentre effettuando il box-plot per il fattore mazza, si evince che le tre mazze sono simili.
Effettuiamo l’analisi dei residui per il fattore palline. Il normplot mostra un andamento
lineare.
Il test di Kolmogorov-Smirnov
kstest(residui1/std(residui1)).
non
rigetta
l’ipotesi
di
gaussianità
dei
dati
Effettuiamo l’analisi dei residui per il fattore mazza. Il normplot mostra un andamento
lineare.
Il test di Kolmogorov-Smirnov
kstest(residui/std(residui)).
non
rigetta
l’ipotesi
di
gaussianità
dei
dati
Per rispondere al secondo quesito dell’esercizio, si osservi che qui va impiegato il modello
HB, poiché il valore nominale è infinito. In questo caso va calcolata la funzione SN per
ogni cella della tabella data all’inizio:
A
B
C
D1
49.6446
46.0522
46.1271
D2
48.0261
48.3314
46.5490
D3
49.8278
48.7446
45.0530
Pertanto la combinazione A-D3 è quella da scegliere. Questa scelta è in accordo con i
boxplots disegnati: infatti da essi si evince che la pallina A è quella che percorre una
distanza maggiore e la mazza D3 è quella il cui box-plot è maggiormente spinto verso
l’alto.
Soluzione esercizio 3.
Si tratta di costruire una carta per attributi di tipo P (o NP). Il limite superiore va posto
pari a 0.0597 (da mean(p)+3*sqrt(mean(p)*(1-mean(p))/150)), mentre il limite inferiore va
posto pari a 0, poiché mean(p)-3*sqrt(mean(p)*(1-mean(p))/150) è negativo. Il limite centrale
invece risulta essere 0.0230. La carta dunque risulta essere della seguente forma
Da questa carta si evince che ci sono sicuramente due fuori controllo, in corrispondenza
del campione n. 9 e del campione n. 17.
Costruiamo le regole di zona (sostituendo al 3, prima il valore 2 e poi il valore 1).
Da qui si evince che anche il campione n. 1 si trova in una posizione che richiede maggiore
indagine, ed anche i campioni 4, 7, 12 e 14. Per la zona B, i campioni 10 e 11 e i campioni 18
e 19 andrebbero ulteriormente ispezionati. In sostanza, il processo non appare in controllo
statistico ed ulteriori indagini andrebbero condotte.