Affidabilità e diagnostica di componenti elettronici Massimo Vanzi Università di Cagliari - DIEE Problema ultimo: Quale è la durata di funzionamento senza guasti di un sistema? Concetti di: Sistema Funzionamento Guasto Rete di elementi Capacità di eseguire operazioni definite, sotto l’azione di stimoli prefissati Uscita dai parametri di tolleranza definiti per il funzionamento Individuazione della grandezza fondamentale: Tempo al Guasto Problemi di misura del Tempo al Guasto (TTF) 1) Misura inutile serve una PREVISIONE 2) Complessità del sistema 3) Lunga vita (Affidabilità) dei sistemi in generale Statistica basata su campioni Riduzione del problema e sintesi dei risultati Accelerazione delle procedure Metodo e programma Modelli statistici, matematici, fisici Esecuzione di prove Affidabilità dei componenti Raccolta di dati sperimentali Sintesi combinatoria Affidabilità dei sistemi Affidabilità dei componenti: una osservazione generale sul Tasso di guasto invecchiamento Mortalità infantile Guasti “estrinseci” tempo Curva a vasca da bagno Tasso di guasto l= Unità di misura: numero di guasti in 1 ora numero di pezzi funzionanti 1 guasto in 1 ora 1 FIT= 1.000.000.000 componenti Esempio: 1000 componenti con l= 100 FIT in 1 anno di funzionamento danno 1000 x 100x10-9 x = 1 guasto 24x365 Definizioni matematiche Probabilità di guasto in 1 ora 1 ora Numero di guasti in 1 ora = N0 f(t)Dt Numero totale di pezzi Numero cumulativo di guasti fino ad ora Numero di pezzi funzionanti Funzione di distribuzione (probabilità istantanea di guasto) t t 0 0 N( t ) N0 f ( y )dy N0 f ( y)dy N0F( t ) N0-N(t)=N0(1-F(t)) d f ( t ) F( t ) dt Funzione cumulativa di guasto Funzione Affidabilità Equazione del tasso di guasto R( t ) 1 F( t ) f (t) f (t) d l ln( 1 F( t )) R( t ) 1 F( t ) dt Tasso di guasto costante: d d ln(1 F(t )) ln( R( t )) l dt dt R( t ) exp( lt ) F( t ) 1 exp( lt ) f ( t ) l exp( lt ) Distribuzione Esponenziale 1/l= MTBF (Mean Time Between Failures) Tempo “libero” medio tra due guasti Un po’ di pratica... t 0 1 2 3 l 0.1 0.1 0.1 0.1 f(t) 0.1*exp(0) 0.1*exp(-0.1) 0.1*exp(-0.1*2) 0.1*exp(-0.1*3) F(t) 1- exp(0) 1- exp(-0.1) 1- exp(-0.1*2) 1- exp(-0.1*3) A cosa serve conoscere la distribuzione ? Per 1 singolo componente Vita attesa Probabilità di guasto nella prossima ora Per un lotto 1/l Vita media f(t) Percentuale oraria di guasto Probabilità di guasto dopo t ore di funzionamento F(t) Percentuale di guasti nelle prime t ore Probabilità di sopravvivenza dopo t ore di funzionamento R(t) Percentuale di pezzi funzionanti dopo le prime t ore Qualifiche R(t)>RMIN La Statistica può andare più in dettaglio: Se impiego 1000 componenti con 100FIT, quale è la probabilità che entro 2 anni NON se ne guastino più di 3? l=100x10-9= t= 2 anni = 2x24x365 = 17520 h 10-7/h R(t)=exp(-lt) F(t)=1-R(t) N0=1000 = 0.9982 = 0.0018 NF=3 La Distribuzione Binomiale, alla base del calcolo delle probabilità, dà NF N0 ! F( t )n R( t )N0 n n0 n! N0 n! PNF ,N0 NF 1 2 3 4 PNF,N0 46% 73% 89% 96% Dividendo la vita dell’ultimo per il numero di pezzi Ma come misuro stimo il tasso di guasto? Dai primi guasti di un campionamento di pezzi messi in funzionamento Dispersione statistica dei tempi al guasto 500 Riordinando per tempi crescenti... trascorso guasto Tempo al 400 300 200 100 0 0 20 40 60 Numero Campione di guasti n. 80 100 N0F(t)=N0 (1-exp(-lt)) Nei grafici delle funzioni cumulative F o R al crescere di t diminuisce l’errore statistico 0.0085 1 ln 1 F( t ) 0.010 2 1 ln 1 F ( t ) l t 0.0115 1.5 N0=100 1 NF F 1 2 3 4 5 6 0.01 0.02 0.03 0.04 0.05 0.06 0.5 0 0 50 100 150 t 200 Una raccomandazione: non abbandonare i buoni vecchi grafici 2 Qualsiasi programma di statistica trova un valore per l. Anche quando la distribuzione NON è esponenziale 1.5 1 0.5 0 0 50 100 150 200 Il grafico mostra subito se una retta passante per l’origine potrà mai interpolare i dati sperimentali Sfortunatamente... …la Distribuzione Esponenziale 1) Non descrive gli estremi del ciclo di vita Occorrono altre distribuzioni 2) Tratta guasti “estrinseci”, sui quali non c’è nulla da fare, se non aggiungere protezioni esterne Hanno senso le prove diverse dal funzionamento Manca la descrizione delle degradazioni interne: normale? le “malattie” dei dispositivi. Distribuzione Lognormale e Legge di Arrhenius I fondamenti statistici delle prove accelerate A) Distribuzione Lognormale Origine della distribuzione Valori del tempo di vita distribuiti casualmente attorno ad un valore più probabile 2 2 11 ln(x t) 11 f f((t )xdt exp dt )dx exp dx 2 22t 2 ln( xt ) 1 1erf erf 22 F(Fx()x) 22 Distribuzione DistribuzioneLognormale Normale Per evitare tempi negativi, si prende per x NON t ma ln(t) La distribuzione lognormale h x ln( x) 2 x F ( x) f (t )dt 0 2 1 ln( x) f ( x)dx exp d (ln( x)) 2 2 In scala lineare, la lognormale si presenta come una gaussiana asimmetrica, “contratta” entro il semiasse positivo delle ascisse (t) Il suo comportamento asintotico per grandi valori di / è quello di una Distribuzione Normale Per bassi valori del medesimo rapporto, invece, diventa simile a quello di una Distribuzione Esponenziale. Fin troppo simile... Quando si applica? Quando esiste un picco della probabilità di guasto Concetto di Durata Usura Si manifesta l’idea di una retroazione possibile sul progetto/processo per modificare la vita utile La misura della Affidabilità entra nel ciclo di miglioramento del prodotto Si intuisce la ipotesi di un processo fisico che porta alla interruzione del funzionamento (guasto) La rilevazione del guasto come interruzione del funzionamento può avvenire anche senza conoscere il processo fisico Ma è solo questa conoscenza che consente la retroazione MECCANISMO di guasto MODO di guasto Cinetica del processo fisico , governati da Condizioni di impiego Distribuzione statistica degli stati iniziali Accelerazione? Rappresentazione grafica dei dati sperimentali Calcolo della distribuzione cumulativa (errori che si riducono con t) 1 nF Fi N0 1 Esempio con N0=10 0.5 0 0.5 riordinando Tempi al guasto 1 1 ti 72 641 nF 1 72 89 2 118 246 3 135 1152 4 142 203 5 203 135 6 246 142 7 10 641 1505 8 100 1152 118 9 3 1 10 4 1 10 1605 89 10 Fi 0.091 0.182 0.273 0.364 0.455 0.545 0.636 0.727 0.818 0.91 yi -0.943 -0.642 -0.427 -0.246 -0.081 0.081 0.246 0.427 0.642 0.943 Linearizzazione 1 erf ( y i ) Fi 0 2 …e tracciato di y vs. ln(t) …oppure uso della carta lognormale h 2,281 1,162 0,905 0,595 0,477 0,369 0,272 0,179 0,089 0,000 -0,089 -0,179 -0,272 -0,369 -0,477 -0,595 -0,730 -0,730 -0,905 -1,162 -2,281 F 100 95 90 80 75 70 65 60 55 50 45 40 35 30 25 20 15 85 10 5 0 h F 2.5 2.0 Costruzione della doppia scala verticale 1.5 1.0 0.5 0.0 -0.5 -1.0 -1.5 -2.0 -2.5 95 90 80 70 60 40 30 20 10 5 50 La parallela passante per il punto di riferimento interseca la scala del 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 =1 1.1 1.2 1.3 1.4 F(t) % 90 X 80 X 70 X X 60 X 50 X X X 40 30 20 X 10 X 1 10 100 1000 10000 La intercetta con F=50% dà la vita piùaprobabile Si traccia una retta dall’ultimo punto ripartire insperimentali due metà i punti Si riportano i punti Mescolanza di differenti cause di guasto 0.95 Irrilevante: totalità di guasti dovuti alla causa con minore 0.5 0.05 ln(t) 0.95 Distribuzione bimodale: cambio di pendenza 0.5 0.05 ln(t) Altre distribuzioni Distribuzione gamma G(t): descrive il non funzionamento come occorrenza causata dall’effetto concomitante di più guasti elementari Meglio trattata come affidabilità di un sistema (modulo prof. Fantini) Distribuzioni dei valori estremi: approssimano le code di distribuzioni (normale, lognormale) con funzioni monotòne Caso limite della esponenziale come limite destro della lognormale Distribuzione di Weibull Tempo libero da guasti (spesso =0) t , t R( t ) exp F( t ) 1 R( t ) 1 t t exp f ( t ) 0, =1 Weibull=esponenziale =3.5 Weibull~ normale Valori intermedi ~ lognormale NON ha giustificazioni statistiche solide come la normale, né ragionevoli adattamenti come la lognormale E’ però una distribuzione a tre parametri invece che a due: un grado di libertà in più, capace di adattare la curva a vari casi Vantaggi: 1) “elasticità” al variare di esponenziale 2) Interessantissima graficabilità 1 ln(ln( )) ln( t ) ln( ) 1 F( t ) lineare in ln(t) con =coeff. angolare ln(ln( 1,5 1 )) 1 F( t ) esponenziale “normale” F(t) 1,0 1,0 90 80 70 60 50 40 30 1,5 20 0,5 ln0,0 0,5 15 2,0 10 2,5 5 3,0 3,5 1 10 100 1000 10000 t Il grafico di Weibull può orientare verso la distribuzione più idonea Distribuzione Lognormale e Legge di Arrhenius I fondamenti statistici delle prove accelerate B) Legge di Arrhenius Ipotesi (legge) di Arrhenius per le distribuzioni lognormali La applicazione di uno stress S maggiore di quello tipico del funzionamento normale, S0, modifica la vita media t50%=exp() di una popolazione secondo la legge: B B B (S) A (S0 ) S S S0 Il parametro di precisione NON viene modificato Le costanti A e B, da determinarsi sperimentalmente, sono tipiche del meccanismo di guasto alla base della distribuzione lognormale Problema della identificazione dello stress (forma matematica in cui S rappresenta un aumento di corrente, tensione, temperatura, umidità, sollecitazione meccanica, ecc.) Caso della Temperatura: B=EA/k Costante di Boltzmann Energia di attivazione EA EA EA (T) A (T0 ) kT kT kT 0 La Energia di Attivazione è solo un modo diverso di esprimere il parametro statistico B. NON ha significati fisici legati a fenomeni definiti. Tuttavia, diverse energie di attivazione indicano diversi meccanismi di guasto in atto Quale accelerazione si può ottenere? EA=0.5 eV 0 T0=25°C=300°K T=100°C=375°K EA T0 0.5 300 1 1 4.8 kT0 T 0.0259 400 t 50% ( 400K ) 1 exp( 0 ) t 50% (300K ) 125 Ma per EA=1 eV 1 exp( 0 ) 15000 Grandi valori di Energia di Attivazione corrispondono a grandi accelerazioni Burn-in Ipotesi: mortalità infantile causata da una popolazione debole caratterizzata da bassa vita media a Toperativa. F(t) debole Vita utile forte ln(t) Screening: 100% dei pezzi esegue 1 settimana a 125°C (esempio MIL-STD-283)) F(t) debole Vita utile Burn-in forte ln(t) La popolazione debole è eliminata La popolazione forte entra in esercizio “invecchiata”. Si spera non troppo... 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 =1 1.1 1.2 1.3 1.4 F(t) % 90 80 70 60 50 40 30 20 10 1 10 100 1000 10000 Prove di vita accelerate 2 prove a diversa temperatura determinano i valori delle costanti 0,EA in tempi ragionevoli (1000 ore o meno) F(t) Distribuzione “vera” 1000h ln(t) Si misura nel contempo , si verifica la distribuzione lognormale (retta) e si visualizza se il meccanismo di guasto è il medesimo (parallelismo) Una terza prova può confermare la legge di Arrhenius Come programmare le prove? Troppo deboli = tempo perso senza risultati Troppo forti = estrapolazione “ardita” alla condizione reale, possibilità di meccanismi di guasto diversi da quelli “veri” Conoscenza dei limiti tecnologici (TMAX) Esperienza (standard di prova e/o dati pregressi su tecnologie simili) Step stress Step stress Stress max stress guasti accumulati tempo Diagnostica