以下內(nèi)容為可靠性知識共享學習會的會員朋友(王進)的經(jīng)驗分享,非常感謝其支持與共享,謝謝!
一、引言近年,國內(nèi)可靠性領(lǐng)域的蓬勃發(fā)展,最近“祝融登火” (一系列各種功能的分子系統(tǒng),經(jīng)歷了發(fā)射階段的高加速度、高強振動,太空飛行階段的超高低溫、強輻射等極端惡劣環(huán)境后登陸火星)成功,就是可靠性發(fā)展最好的詮釋,其中凝聚了可靠性人的辛勞與汗水,這些可靠性人都是可靠性工作者中的佼佼者,值得大家仰慕。
然而,不可否認的事實是,可靠性工作但仍集中于軍工,研究所,少部分大企業(yè)。絕大部分中小企業(yè)因可靠性的較大投入而卻步;另一些大企業(yè)會因可靠性效果的不確定性與見效慢,而認為可靠性是雞肋。從宏觀講,以上種種導致國內(nèi)可靠性的發(fā)展不溫不火;在可靠性工作實施過程中,尤其是在企業(yè)推行可靠性時,一些對可靠性的誤解,讓可靠性變得“不可靠”,讓可靠性人哭笑不得,極為尷尬。本文主要從以下幾個方面來進行介紹淺談。
二、缺少時間參數(shù)的可靠度
說起可靠性,會經(jīng)常被談?wù)?/span>“可靠度”指標。比如“聽說XX公司XX產(chǎn)品的可靠度是0.9,那我們公司的產(chǎn)品的可靠度是多少”之類。相信大多數(shù)可靠性人不會正面回答該問題,而是從可靠度的定義“產(chǎn)品在規(guī)定的條件下和規(guī)定的時間內(nèi),完成規(guī)定功能的概率”來解釋可靠度函數(shù)R(t)是一個時間參數(shù)的函數(shù)。脫離時間參數(shù)講可靠度,就是拿不同的量具量測不同的事物,量測出的結(jié)果也就毫無意義,即便時間參數(shù)相同,不同的產(chǎn)品類型,可靠度值的大小也不應(yīng)被拿出來對比。
三、讓人抓狂的壽命指標
介紹以下幾個壽命指標的簡要定義:a.平均壽命Mean Life:產(chǎn)品壽命的平均值;
b.中位壽命Median Life:產(chǎn)品壽命排序后的中位值;
c. MTBF:平均故障間隔時間;
d. MTTF:平均失效前時間;
e.特征壽命:Weibull函數(shù)的尺寸參數(shù)η
f. Bx壽命:累積達到x%的產(chǎn)品失效的時間點。
相信剛接觸這些壽命概念的人,一定會混淆,一旦被人追問,就會抓狂。
在此簡單總結(jié)以下這幾個壽命指標的差異分別見表一:
表一
某案例分析中出現(xiàn)的幾種壽命指標,見圖一:
綜上,不同的方式計算出的壽命指標不具備比較性,即如果衡量某產(chǎn)品不同階段的壽命,必須采用相同的計算方式,相同的壽命指標才能橫縱向?qū)Ρ取?/span>
四、條件可靠度R(T,t)預(yù)估返修數(shù)的漂移條件可靠度R(T,t):工作到某時刻T時尚未失效的產(chǎn)品,在該時刻T之后的某段時間t內(nèi)不發(fā)生失效的概率。
相信很多企業(yè)領(lǐng)導在接觸條件可靠度后,會要求可靠性人對企業(yè)產(chǎn)品的返修數(shù)進行預(yù)估。于是乎,可靠性人經(jīng)過返修數(shù)據(jù)收集,統(tǒng)計分析,失效概率分布,條件可靠度推算后,得出一串的預(yù)估的返修數(shù),甚至都加上90%的正態(tài)置信區(qū)間,而且還反推出最近一次的實際返修數(shù)在預(yù)估返修數(shù)的置信區(qū)間內(nèi)。到此,本以為干了一件很“漂亮”的活,可是隨著t的增大,多數(shù)人會發(fā)現(xiàn)實際返修數(shù)在逐步從置信區(qū)間內(nèi)漂移到置信區(qū)間外,可靠性人的心開始變得“哇涼哇涼”。這是為什么呢?梳理一下R(T,t)的計算公式:
從統(tǒng)計學角度,在此公式中,已知返修數(shù)據(jù)的失效分布函數(shù)需服從weibull概率密度函數(shù),那么問題來了,如何判定失效分布服從weibull分布?而實際返修數(shù)據(jù)為右刪失數(shù)據(jù),無法采用檢定的方式進行判定,通常有兩種處理方式:
一是直接假定服從weibull分布。該方式可以保證每次都用相同的計算方式和相同的壽命指標。示例見圖二:
圖二
二是采用分布ID圖極大似然估計進行分布評估,通常選擇AD值較小的分布函數(shù)。該方式可以保證已有的數(shù)據(jù)擬合度較高,但當數(shù)據(jù)更新后,每次選擇的分布函數(shù)不一定相同。
示例見圖三、圖四:
圖三
圖四
綜上,無論選擇哪一種方式,都無法保證失效分布嚴格服從weibull(或其它)分布,就會導致出現(xiàn)預(yù)估“失敗”。如圖四中,正態(tài)分布已是AD值最小的分布函數(shù),但可以看出,隨著時間軸向右推移,曲線必然漂移出置信區(qū)間。
為什么會出現(xiàn)失效分布不符合分布函數(shù)呢?其實對于單一失效模式,且數(shù)據(jù)是全數(shù)據(jù)時,通常都服從某種分布函數(shù)。而實際產(chǎn)品,通常有多種失效模式,當無法有效將多種失效模式識別區(qū)分開,多個分布函數(shù)的數(shù)據(jù)疊加后,就不再服從任何分布函數(shù)了。也就是,產(chǎn)品系統(tǒng)越復(fù)雜,條件可靠度漂移越嚴重。
五、可靠性預(yù)計工作的尷尬
現(xiàn)行的常規(guī)做法,選用20世紀90年代發(fā)布的美國軍用標準217F和2006年發(fā)布的中國軍用標準299C。按照這些標準中的預(yù)計模型,計算[祝融]的失效率的步驟是:先從標準中查到每一類元器件的失效率,根據(jù)制造和使用條件,選擇對應(yīng)的修正因子,得到每個元器件的失效率,再將所有元器件的失效率進行相加,得到整機的失效率。然而組成[祝融]的零件應(yīng)該數(shù)以百萬計,經(jīng)過相加后,[祝融]的失效率必定高到讓自己都懷疑人生,無法回應(yīng)領(lǐng)導和客戶的質(zhì)疑。
這種令人難以置信的預(yù)計結(jié)果幾乎沒人會相信,喪失專業(yè)權(quán)威性,被決策者直接跳過或者忽略,這也是可靠性人的噩夢。
造成這個結(jié)果的原因:
一是標準陳舊,很多元器件的技術(shù)不斷進步,標準中的失效率和修正因子已不適用;而且還有很多新元器件在標準中找不到預(yù)計模型;
二是標準中采用元器件失效率直接相加的算法不科學。這樣的算法的底層數(shù)學邏輯是概率乘積定理,而該定理使用的前提:是獨立事件的發(fā)生概率相乘。工程實踐中,這樣的假設(shè)是不存在的,各種元器件相互關(guān)聯(lián),也是失效相聯(lián),這種聯(lián)系對產(chǎn)品整體失效率的影響,直接被元器件失效率的“加和”算法無視了。
以上零零總總,有的需要可靠性人耐心的講解可靠性詞匯的定義和差異;有的是因為信息的不明確及模型適用性受限,導致無法得出“有效”的結(jié)果;還有的是可靠性技術(shù)發(fā)展受限,導致可靠性結(jié)論失真,導致工作成果遭到忽略。
國內(nèi)企業(yè)的發(fā)展,首先考慮的是生存問題,其次是盈利問題,再其次才是質(zhì)量可靠性造成的品牌問題,加之可靠性的“不可靠”,導致可靠性工作大多被邊緣化,生存土壤劣化,嚴重制約國內(nèi)可靠性的發(fā)展。
隨著國內(nèi)經(jīng)濟、技術(shù)不斷發(fā)展,越來越多的企業(yè)已經(jīng)進入行業(yè)前沿,基本無需考慮生存問題和盈利問題,此時可靠性問題逐步浮出水面。但可靠性的發(fā)展并不可一蹴而就,需要積累深耕。越來越多的前沿企業(yè)已經(jīng)意識到這種趨勢,開始開展可靠性活動,也希望他們能了解可靠性的“不可靠”,能在工作中給予更多的支持和包容,讓可靠性人能更充分,更安心的開展工作,讓企業(yè)可靠性更上一層樓,躋身為行業(yè)領(lǐng)跑者。
以上內(nèi)容,若有不正確,請指導修正,歡迎持續(xù)討論,謝謝!