Affidabilità e diagnostica
di
componenti elettronici
Massimo Vanzi
Università di Cagliari - DIEE
Problema ultimo:
Quale è la durata di funzionamento
senza guasti di un sistema?
Concetti di:
Sistema
Funzionamento
Guasto
Rete di elementi
Capacità di eseguire
operazioni definite,
sotto l’azione di stimoli
prefissati
Uscita dai parametri di tolleranza
definiti per il funzionamento
Individuazione della grandezza fondamentale:
Tempo al Guasto
Problemi di misura del Tempo al Guasto (TTF)
1) Misura inutile  serve una PREVISIONE
2) Complessità del sistema
3) Lunga vita (Affidabilità) dei sistemi in generale
Statistica basata su campioni
Riduzione del problema e sintesi dei risultati
Accelerazione delle procedure
Metodo e programma
Modelli statistici, matematici, fisici
Esecuzione di prove
Affidabilità dei componenti
Raccolta di dati sperimentali
Sintesi combinatoria
Affidabilità dei sistemi
Affidabilità dei componenti:
una osservazione generale sul
Tasso di guasto
invecchiamento
Mortalità infantile
Guasti “estrinseci”
tempo
Curva a vasca da bagno
Tasso di guasto l=
Unità di misura:
numero di guasti in 1 ora
numero di pezzi funzionanti
1 guasto in 1 ora
1 FIT=
1.000.000.000 componenti
Esempio: 1000 componenti con l= 100 FIT in 1 anno di funzionamento
danno
1000
x
100x10-9
x
= 1 guasto
24x365
Definizioni matematiche
Probabilità di guasto in 1 ora
1 ora
Numero di guasti in 1 ora = N0 f(t)Dt
Numero totale di pezzi
Numero cumulativo di guasti
fino ad ora
Numero di pezzi funzionanti
Funzione di distribuzione
(probabilità istantanea
di guasto)
t
t
0
0
N( t )   N0 f ( y )dy  N0  f ( y)dy  N0F( t )
N0-N(t)=N0(1-F(t))
d
f ( t )  F( t )
dt
Funzione cumulativa
di guasto
Funzione Affidabilità
Equazione del
tasso di guasto
R( t )  1  F( t )
f (t)
f (t)
d
l

  ln( 1  F( t ))
R( t ) 1  F( t )
dt
Tasso di guasto costante:
d
d
ln(1  F(t ))  ln( R( t ))  l
dt
dt
R( t )  exp( lt )
F( t )  1  exp( lt )
f ( t )  l exp( lt )
Distribuzione Esponenziale
1/l= MTBF (Mean Time Between Failures)
Tempo “libero” medio tra due guasti
Un po’ di pratica...
t
0
1
2
3
l
0.1
0.1
0.1
0.1
f(t)
0.1*exp(0)
0.1*exp(-0.1)
0.1*exp(-0.1*2)
0.1*exp(-0.1*3)
F(t)
1- exp(0)
1- exp(-0.1)
1- exp(-0.1*2)
1- exp(-0.1*3)
A cosa serve conoscere la distribuzione ?
Per 1 singolo componente
Vita attesa
Probabilità di guasto
nella prossima ora
Per un lotto
1/l
Vita media
f(t)
Percentuale oraria di guasto
Probabilità di guasto
dopo t ore di funzionamento
F(t)
Percentuale di guasti
nelle prime t ore
Probabilità di sopravvivenza
dopo t ore di funzionamento
R(t)
Percentuale di pezzi
funzionanti dopo le prime t ore
Qualifiche R(t)>RMIN
La Statistica può andare più in dettaglio:
Se impiego 1000 componenti con 100FIT, quale è la probabilità
che entro 2 anni NON se ne guastino più di 3?
l=100x10-9=
t= 2 anni = 2x24x365 = 17520 h
10-7/h
R(t)=exp(-lt)
F(t)=1-R(t)
N0=1000
= 0.9982
= 0.0018
NF=3
La Distribuzione Binomiale, alla base del calcolo delle probabilità,
dà
NF
N0 !
F( t )n R( t )N0 n
n0 n! N0  n!
PNF ,N0  
NF
1
2
3
4
PNF,N0
46%
73%
89%
96%
Dividendo la vita dell’ultimo
per il numero di pezzi
Ma come misuro
stimo il tasso di guasto?
Dai primi guasti di un campionamento di pezzi messi in funzionamento
Dispersione statistica
dei tempi al guasto
500
Riordinando
per tempi crescenti...
trascorso
guasto
Tempo al
400
300
200
100
0
0
20
40
60
Numero
Campione
di guasti
n.
80
100
N0F(t)=N0 (1-exp(-lt))
Nei grafici delle funzioni cumulative F o R
al crescere di t diminuisce l’errore statistico
0.0085
 1 
ln 

1  F( t ) 
0.010
2
 1 
ln 

1

F
(
t
)

l 
t
0.0115
1.5
N0=100
1
NF
F
1
2
3
4
5
6
0.01
0.02
0.03
0.04
0.05
0.06
0.5
0
0
50
100
150
t
200
Una raccomandazione: non abbandonare i buoni vecchi grafici
2
Qualsiasi programma
di statistica
trova un valore
per l.
Anche quando
la distribuzione NON è
esponenziale
1.5
1
0.5
0
0
50
100
150
200
Il grafico mostra subito
se una retta
passante per l’origine
potrà mai interpolare
i dati sperimentali
Sfortunatamente...
…la Distribuzione Esponenziale
1) Non descrive gli estremi del ciclo di vita
Occorrono altre distribuzioni
2) Tratta guasti “estrinseci”, sui quali
non c’è nulla da fare, se non aggiungere
protezioni esterne
Hanno senso
le prove diverse
dal funzionamento
Manca la descrizione delle degradazioni interne: normale?
le “malattie” dei dispositivi.
Distribuzione Lognormale
e
Legge di Arrhenius
I fondamenti statistici delle prove accelerate
A) Distribuzione Lognormale
Origine della distribuzione
Valori del tempo di vita distribuiti casualmente attorno ad
un valore più probabile
2 2
  11 ln(x t) 
11



f f((t )xdt
exp
 dt
)dx 
exp  
  dx
2

22t   2     
 ln(
 xt ) 
1 1erf

 erf

   22  
F(Fx()x) 
22
Distribuzione
DistribuzioneLognormale
Normale
Per evitare tempi negativi, si prende per x NON t ma
ln(t)
La distribuzione lognormale
h x  
ln( x)  
 2
x
F ( x)   f (t )dt
0
2

1
 ln( x)    
f ( x)dx 
exp  
  d (ln( x))
2 
   2  
In scala lineare, la lognormale si presenta come una gaussiana
asimmetrica, “contratta” entro il semiasse positivo delle ascisse (t)
Il suo comportamento asintotico per grandi valori di / è quello
di una Distribuzione Normale
Per bassi valori del medesimo rapporto, invece, diventa simile
a quello di una Distribuzione Esponenziale. Fin troppo simile...
Quando si applica?
Quando esiste un picco della probabilità di guasto
Concetto di
Durata
Usura
Si manifesta l’idea di una retroazione possibile
sul progetto/processo per modificare la vita utile
La misura della Affidabilità entra nel ciclo
di miglioramento del prodotto
Si intuisce la ipotesi di un processo fisico che porta alla interruzione
del funzionamento (guasto)
La rilevazione del guasto come interruzione del funzionamento può
avvenire anche senza conoscere il processo fisico
Ma è solo questa conoscenza che consente la retroazione
MECCANISMO di guasto
MODO di guasto
Cinetica del processo fisico
, governati da
Condizioni di impiego
Distribuzione statistica degli stati iniziali
Accelerazione?
Rappresentazione grafica dei dati sperimentali
Calcolo della distribuzione cumulativa (errori che si riducono con t)
1
nF
Fi 
N0  1
Esempio con N0=10
0.5
0
0.5
riordinando
Tempi
al guasto
1
1
ti 72
641
nF 1
72
89
2
118
246
3
135
1152
4
142
203
5
203
135
6
246
142
7
10
641
1505
8
100
1152
118
9
3
1 10
4
1 10
1605
89
10
Fi 0.091 0.182 0.273 0.364 0.455 0.545
0.636
0.727
0.818
0.91
yi -0.943 -0.642 -0.427 -0.246 -0.081 0.081
0.246
0.427
0.642
0.943
Linearizzazione
1  erf ( y i )
 Fi  0
2
…e tracciato di
y vs. ln(t)
…oppure uso della carta lognormale
h
2,281
1,162
0,905
0,595
0,477
0,369
0,272
0,179
0,089
0,000
-0,089
-0,179
-0,272
-0,369
-0,477
-0,595
-0,730
-0,730
-0,905
-1,162
-2,281
F
100
95
90
80
75
70
65
60
55
50
45
40
35
30
25
20
15
85
10
5
0
h
F
2.5
2.0
Costruzione della doppia scala verticale
1.5
1.0
0.5
0.0
-0.5
-1.0
-1.5
-2.0
-2.5
95
90
80
70
60
40
30
20
10
5
50
La parallela passante per il punto di riferimento interseca la scala del 
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
=1 1.1
1.2
1.3
1.4
F(t)
%
90
X
80
X
70
X
X
60
X
50
X
X
X
40
30
20
X
10
X
1
10
100
1000
10000
La
intercetta
con
F=50%
dà la vita
piùaprobabile
Si traccia
una
retta
dall’ultimo
punto
ripartire
insperimentali
due metà i punti
Si
riportano
i punti
Mescolanza di differenti cause di guasto
0.95
Irrilevante: totalità di guasti
dovuti alla causa con  minore
0.5
0.05
ln(t)
0.95
Distribuzione bimodale:
cambio di pendenza
0.5
0.05
ln(t)
Altre distribuzioni
Distribuzione gamma G(t): descrive il non funzionamento come
occorrenza causata dall’effetto concomitante di più guasti elementari
Meglio trattata come affidabilità
di un sistema (modulo prof. Fantini)
Distribuzioni dei valori estremi: approssimano le code di distribuzioni
(normale, lognormale) con funzioni monotòne
Caso limite della esponenziale
come limite destro della lognormale
Distribuzione di Weibull
Tempo libero da guasti (spesso =0)
  t    
 , t  
R( t )  exp  
    
F( t )  1  R( t )
 1


t 
t
 exp  
 
f ( t )  
  
    
0, =1 Weibull=esponenziale
=3.5 Weibull~ normale
Valori intermedi ~ lognormale
NON ha giustificazioni statistiche solide come la normale,
né ragionevoli adattamenti come la lognormale
E’ però una distribuzione a tre parametri invece che a due:
un grado di libertà in più, capace di adattare la curva a vari casi
Vantaggi: 1) “elasticità” al variare di 
esponenziale
2) Interessantissima graficabilità
1
ln(ln(
))   ln( t )   ln( )
1  F( t )
lineare in ln(t) con =coeff. angolare
ln(ln(
1,5
1
))
1  F( t )
esponenziale
“normale”
F(t)
1,0
1,0
90
80
70
60
50
40
30
1,5
20
0,5
ln0,0


0,5
15
2,0
10
2,5
5
3,0
3,5
1
10
100
1000
10000
t
Il grafico di Weibull può orientare verso la distribuzione più idonea
Distribuzione Lognormale
e
Legge di Arrhenius
I fondamenti statistici delle prove accelerate
B) Legge di Arrhenius
Ipotesi (legge) di Arrhenius per le distribuzioni lognormali
La applicazione di uno stress S maggiore di quello tipico del funzionamento
normale, S0, modifica la vita media t50%=exp() di una popolazione secondo
la legge:
B B 
B
(S)  A   (S0 )    
S
 S S0 
Il parametro di precisione  NON viene modificato
Le costanti A e B, da determinarsi sperimentalmente, sono tipiche
del meccanismo di guasto alla base della distribuzione lognormale
Problema della identificazione dello stress (forma matematica in cui
S rappresenta un aumento di corrente, tensione, temperatura, umidità,
sollecitazione meccanica, ecc.)
Caso della Temperatura: B=EA/k
Costante di Boltzmann
Energia di attivazione
EA EA 
EA
(T)  A 
 (T0 )  


kT
kT
kT
0

La Energia di Attivazione è solo un modo diverso di esprimere
il parametro statistico B. NON ha significati fisici legati a fenomeni
definiti.
Tuttavia, diverse energie di attivazione indicano diversi meccanismi
di guasto in atto
Quale accelerazione si può ottenere?
EA=0.5 eV
  0 
T0=25°C=300°K
T=100°C=375°K
EA  T0
0.5  300 


1

 1  4.8



kT0  T
 0.0259  400 
t 50% ( 400K )
1
 exp(    0 ) 
t 50% (300K )
125
Ma per EA=1 eV
1
exp(    0 ) 
15000
Grandi valori di Energia di Attivazione corrispondono a grandi accelerazioni
Burn-in
Ipotesi: mortalità infantile causata da una popolazione debole
caratterizzata da bassa vita media a Toperativa.
F(t)
debole
Vita utile
forte
ln(t)
Screening: 100% dei pezzi esegue 1 settimana a 125°C (esempio MIL-STD-283))
F(t)
debole
Vita utile
Burn-in
forte
ln(t)
La popolazione debole è eliminata
La popolazione forte entra in esercizio “invecchiata”. Si spera non troppo...
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
=1 1.1
1.2
1.3
1.4
F(t)
%
90
80
70
60
50
40
30
20
10
1
10
100
1000
10000
Prove di vita accelerate
2 prove a diversa temperatura determinano i valori delle costanti 0,EA
in tempi ragionevoli (1000 ore o meno)
F(t)
Distribuzione “vera”
1000h
ln(t)
Si misura nel contempo , si verifica la distribuzione lognormale (retta)
e si visualizza se il meccanismo di guasto è il medesimo (parallelismo)
Una terza prova può confermare la legge di Arrhenius
Come programmare le prove?
Troppo deboli = tempo perso senza risultati
Troppo forti = estrapolazione “ardita” alla condizione reale,
possibilità di meccanismi di guasto diversi da quelli “veri”
Conoscenza dei limiti tecnologici (TMAX)
Esperienza (standard di prova e/o dati pregressi su tecnologie simili)
Step stress
Step stress
Stress max
stress
guasti accumulati
tempo
Diagnostica