Presentazione di PowerPoint - Dipartimento di Matematica

 Problema 1: Vengono messi in prova simultanea 30
componenti, supponendo che abbiano vita esponenziale
i.i.d.; il test viene interrotto quando si verifica l'ottavo
guasto. I tempi di fallimento, in ore, sono i seguenti:
0.35
0.73
0.99
1.40
1.45
1.83
2.20
2.72
(1) Calcolare un intervallo di confidenza bilaterale al
5% di significatività per il tempo di vita medio;
(2) Tracciare il grafico delle probabilità di
sopravvivenza vs. tempo, secondo il metodo di KaplanMeier.
 Anni ’30: primi concetti di Teoria dell’Affidabilità
(industria aeronautica)
 Secondo Dopoguerra: si crea un insieme organico
di concetti basati sulla definizione di affidabilità in
termini probabilistici
 Oggi: ampliamento della disciplina grazie a
numerose tecniche basate su strumenti matematici e
ingegneristici, con possibilità di applicazione in
svariati campi
 Un prodotto si considera di alta qualità se risulta
conforme alle sue norme di funzionamento e
incontra le esigenze del consumatore
 Un sistema si dice affidabile se continua a
funzionare secondo le esigenze specifiche per un
periodo sufficientemente lungo
 Lunghezza dell’intervallo di tempo X dall’attivazione
di un componente (al tempo t = 0) fino al suo guasto
 La rottura di un sistema o di un suo particolare
componente è di natura completamente casuale,
dunque X è modellizzato da una variabile aleatoria
continua che assume valori non negativi
 Indichiamo con FX t  la sua funzione di ripartizione
e con f X t  la sua densità di probabilità
 La funzione di affidabilità (o reliability function) di
un componente è definita come la probabilità che
quest’ultimo sia ancora funzionante al tempo t, vale a
dire:
R X (t )  P X  t 
 E’ determinata univocamente dalla funzione F t  ,
infatti per le proprietà di funzione di distribuzione:
R X (t )  P X  t   1  P X  t   1  F t 
t0
 E’ la funzione definita da:
f t 
f t 
 t  :

Rt  1  F t 
t0
 Determina univocamente la funzione di distribuzione
della variabile aleatoria X :

FX t   1  exp    s ds
t
0

FF
f t dt
P X  t , t  dt 
 t dt :


1  F t 
1  F t 
P X  t , t  dt  P X  t , t  dt , X  t 


P X  t 
P X  t 
 P X  t , t  dt  | X  t 
 Dunque la quantità  t  rappresenta la densità di probabilità
che se il sistema è ancora attivo all’istante t, esso si guasti
nell’immediato futuro, cioè nell’intervallo (t,t+dt)
 Proprietà di “assenza di memoria”:
P  X  t  s, X  t  P  X  t  s 


P X  t  s | X  t  
P X  t 
P X  t 
e   t  s 
 s
 P X  s 

e

 t
e
cioè la distribuzione della vita residua di un oggetto
avente età t è perfettamente identica a quella di un
oggetto nuovo
 Di conseguenza l’intensità di rottura deve essere
una funzione costante nel tempo, come è verificato nei
seguenti passaggi:
 s

e
ds  1  e  t
F t   0
t
 t
f t 

e

 t  :



t
1  F t 
e
 Se si vogliono effettuare test per la stima del tempo
medio di vita in un campione, ci si può trovare di fronte a
3 diversi schemi di prova:
1. Prove simultanee e interruzione al fallimento
r-esimo;
2. Prove sequenziali;
3. Test simultaneo con interruzione ad un tempo
fissato.
 In ognuno di questi casi si trova, mediante alcuni
passaggi, che lo stimatore di massima verosimiglianza del
tempo medio di vita  è dato da:
r
̂ :
 X    n  r X  
i 1
i
r
r
:

r
dove  è il cosiddetto Total Time on Test (statistica del
tempo totale di funzionamento) e r è il numero totale di
guasti che si sono verificati durante l’esperimento.
 Alla luce di alcune considerazioni, osserviamo che  ,
essendo la somma di r variabili esponenziali i.i.d., di
media  , ha distribuzione gamma di parametri r e 1  .
 Ricordando le seguenti implicazioni:
2 ~  1 
2
 r ,  
 ~  r , 1  


 2
 
ricaviamo che
 2

2
2
P   
     1  
,2r
1 , 2 r

2
 2

~
 2r2
Quantili chi-quadrato
 Quindi vi è un livello di confidenza 1   nell’affermare
che:

 2
2
,
  2
2



 1  , 2 r
,2r
2
 2





 Data la funzione di intensità di rottura:
 t    t
 1
t 0
con  e  costanti positive arbitrarie, la distribuzione di X
che corrisponde a una tale scelta di  t  prende il nome di
distribuzione di Weibull di parametri  e  ( X ~ W  ,   ).
 Risulta essere una generalizzazione della distribuzione
esponenziale
 I dati relativi ai tempi di sopravvivenza tengono conto
anche delle osservazioni censurate, cioè quelle osservazioni
che sono “sopravvissute” fino ad un certo istante e poi sono
state rimosse dall’indagine
 Le tecniche di Analisi della Sopravvivenza possono
adattare tali osservazioni e usarle in test statistici di
significatività e nella stima di modelli
 Per stabilire la qualità di un determinato prodotto è
fondamentale l’affidabilità garantita dal prodotto stesso
 Obiettivo: quantificare questa attendibilità, per ricavare
stime del tempo di vita utile del prodotto
 Negli ultimi decenni si sono sviluppate molte tecniche
specializzate in questo senso, con lo scopo di determinare in
modo significativo la “probabilità di vita” di un oggetto
 Proposto per la prima volta nel 1958, permette una stima
della funzione di sopravvivenza
 Il metodo consiste nell’ordinare in modo crescente i
tempi di sopravvivenza t1 , t 2 ,..., t n rilevati; in corrispondenza
ad ogni “evento” i si trova il numero di soggetti ( ni) ancora
in vita immediatamente prima dell’evento e il numero di
fallimenti d i . La stima per i tempi t i è data dalla formula
ricorrente:

ni  d i 
S ti  
 S ti 1 
ni
 In un tempo precedente al primo evento tutti i soggetti
sono in vita, dunque denotando con t0 l’inizio
dell’esperimento si ha che S t0   1
 Per le osservazioni censurate d i  0
 La curva di sopravvivenza non viene modificata al
tempo esatto di un’osservazione censurata, ma all’evento
immediatamente successivo a tale osservazione, quando il
numero di soggetti a rischio viene ridotto
 Problema 1: Vengono messi in prova simultanea 30
componenti, supponendo che abbiano vita esponenziale
i.i.d.; il test viene interrotto quando si verifica l'ottavo
guasto. I tempi di fallimento, in ore, sono i seguenti:
0.35
0.73
0.99
1.40
1.45
1.83
2.20
2.72
(1) Calcolare un intervallo di confidenza bilaterale al
5% di significatività per il tempo di vita medio;
(2) Tracciare il grafico delle probabilità di
sopravvivenza vs. tempo, secondo il metodo di KaplanMeier.
 Comandi principali:
> T <- (sum(z[1:8])+(n-r)*z[8])
In tal modo si determina il Total Time on Test, indicando con:
 z il vettore contenente i 30 dati dell’esperimento
 n il numero totale di tempi registrati [in questo caso 30]
 r il numero di fallimenti [in questo caso 8]
 Comandi principali:
> alfa <- c(0.05)
Fissato il livello di significatività pari al 5%, calcoliamo i
valori delle due statistiche chi-quadro di cui abbiamo bisogno
per costruire l’ intervallo di confidenza:
> v <- qchisq((alfa/2),(2*r))
> w <- qchisq((1-alfa/2),(2*r))
 Comandi principali:
> a <- ((2*T)/w)
> b <- ((2*T)/v)
Definisco così gli estremi. Per avere conferma del fatto che
l’intervallo trovato sia ragionevole [in questo caso
(4.96,20.70)], calcoliamo lo stimatore di massima
verosimiglianza e controlliamo che sia contenuto in esso:
> theta1 <- T/r
Il valore calcolato [8.94] ricade nell’intervallo.
 Comandi principali:
> test1 <- list(time= c(z), status=
c(1,1,1,1,1,1,1,1,0,0,0,0,0,0,0,0,0,0,0,0,0,
0,0,0,0,0,0,0,0,0))
> Surv(test1$time, test1$status)
[1] 0.35 0.73 0.99 1.40 1.45 1.83
2.20 2.72 2.72+ 2.72+ 2.72+ 2.72+
[13] 2.72+ 2.72+ 2.72+ 2.72+ 2.72+ 2.72+
2.72+ 2.72+ 2.72+ 2.72+ 2.72+ 2.72+
[25] 2.72+ 2.72+ 2.72+ 2.72+ 2.72+ 2.72+
 Comandi principali:
> fit <- survfit(Surv(time, status),
data=test1)
> plot(fit, main="Curva di sopravvivenza
(Kaplan-Meier)")
Questi comandi ci permettono di costruire la curva di
sopravvivenza con il metodo di Kaplan-Meier.
Bibliografia
[1] Sheldon M. Ross (2003), Probabilità e
Statistica per l’Ingegneria e le Scienze,
Apogeo.
[2] B.V. Gnedenko, K. Belyayev, A.D.
Solovyev (1969), Mathematical Methods of
Reliability Theory, Academic Press.
[3] Nozioni tratte dal sito Electronic Textbook
StatSoft,
“www.statsoft.com/textbook.html”.