MTBF,平均故障間隔時(shí)間
作者: 來源: 文字大小:[大][中][小]
MTBF,平均故障間隔時(shí)間又稱平均無故障時(shí)間,英文全稱是“Mean Time Between Failure”指可修復(fù)產(chǎn)品兩次相鄰故障之間的平均時(shí)間,記為MTBF。MTBF是衡量一個(gè)產(chǎn)品(尤其是電器產(chǎn)品)的可靠性指標(biāo)。單位為“小時(shí)”。它反映了產(chǎn)品的時(shí)間質(zhì)量,是體現(xiàn)產(chǎn)品在規(guī)定時(shí)間內(nèi)保持功能的一種能力。具體來說,它僅適用于可維修產(chǎn)品。同時(shí)也規(guī)定產(chǎn)品在總的使用階段累計(jì)工作時(shí)間與故障次數(shù)的比值為MTBF。磁盤陣列產(chǎn)品一般MTBF不能低于50000小時(shí)。
隨著伺服器的廣泛應(yīng)用,對(duì)伺服器的可靠性提出了更高的要求。所謂“可靠性”,就是產(chǎn)品在規(guī)定條件下和規(guī)定時(shí)間內(nèi)完成規(guī)定功能的能力;反之,產(chǎn)品或其一部分不能或?qū)⒉荒芡瓿梢?guī)定的功能是出故障。概括地說,產(chǎn)品故障少的就是可靠性高,產(chǎn)品的故障總數(shù)與壽命單位總數(shù)之比叫“故障率”(Failure rate),常用λ表示。例如正在運(yùn)行中的100只硬碟,一年之內(nèi)出了2次故障,則每個(gè)硬碟的故障率為0.02次/年。當(dāng)產(chǎn)品的壽命服從指數(shù)分布時(shí),其故障率的倒數(shù)就叫做平均故障間隔時(shí)間(Mean Time Between Failures),簡稱MTBF。
設(shè)有一個(gè)可修復(fù)的產(chǎn)品在使用過程中,共計(jì)發(fā)生過N0次故障,每次故障后經(jīng)過修復(fù)又和新的一樣繼續(xù)投入使用,其工作時(shí)間分別為:那么產(chǎn)品的平均故障間隔時(shí)間,也就是平均壽命為Q為:
通常,我們?cè)诋a(chǎn)品的手冊(cè)或包裝上能夠看到這個(gè)MTBF值,如8000小時(shí),2萬小時(shí),那么,MTBF的數(shù)值是怎樣算出來的呢,假設(shè)一臺(tái)電腦的MTBF 為3萬小時(shí),是不是把這臺(tái)電腦連續(xù)運(yùn)行3萬小時(shí)檢測(cè)出來的呢?答案是否定的,如果是那樣的話,我們有那么多產(chǎn)品要用幾十年都檢測(cè)不完的。其實(shí),關(guān)于 MTBF值的計(jì)算方法,目前最通用的權(quán)威性標(biāo)準(zhǔn)是MIL-HDBK-217、GJB/Z299B和Bellcore,分別用于軍工產(chǎn)品和民用產(chǎn)品。其中,MIL-HDBK-217是由美國國防部可靠性分析中心及Rome實(shí)驗(yàn)室提出并成為行業(yè)標(biāo)準(zhǔn),專門用于軍工產(chǎn)品MTBF值計(jì)算,GJB/Z299B是我國軍用標(biāo)準(zhǔn);而Bellcore是由AT&TBell實(shí)驗(yàn)室提出并成為商用電子產(chǎn)品MTBF值計(jì)算的行業(yè)標(biāo)準(zhǔn)。
MTBF計(jì)算中主要考慮的是產(chǎn)品中每個(gè)器件的失效率。但由于器件在不同的環(huán)境、不同的使用條件下其失效率會(huì)有很大的區(qū)別,例如,同一產(chǎn)品在不同的環(huán)境下,如在實(shí)驗(yàn)室和海洋平臺(tái)上,其可靠性值肯定是不同的;又如一個(gè)額定電壓為16V的電容在實(shí)際電壓為25V和5V下的失效率肯定是不同的。所以,在計(jì)算可靠性指標(biāo)時(shí),必須考慮上述多種因素。所有上述這些因素,幾乎無法通過人工進(jìn)行計(jì)算,但借助于軟件如MTBFcal軟件和其龐大的參數(shù)庫,我們就能夠輕松的得出MTBF值。
可靠性是最初是確定一個(gè)系統(tǒng)在一個(gè)特定的運(yùn)行時(shí)間內(nèi)有效運(yùn)行的概率的一個(gè)標(biāo)準(zhǔn)。可靠性的衡量需要系統(tǒng)在某段時(shí)間內(nèi)保持正常的運(yùn)行。
目前,使用最為廣泛的一個(gè)衡量可靠性的參數(shù)是,MTTF(mean time to failure,平均失效前時(shí)間),定義為隨機(jī)變量、出錯(cuò)時(shí)間等的"期望值"。但是,MTTF經(jīng)常被錯(cuò)誤地理解為,"能保證的最短的生命周期"。MTTF 的長短,通常與使用周期中的產(chǎn)品有關(guān),其中不包括老化失效。
MTTR(mean time to restoration,平均恢復(fù)前時(shí)間),源自于IEC 61508中的平均維護(hù)時(shí)間(mean time to repair),目的是為了清楚界定術(shù)語中的時(shí)間的概念,MTTR是隨機(jī)變量恢復(fù)時(shí)間得期望值。它包括確認(rèn)失效發(fā)生所必需的時(shí)間,以及維護(hù)所需要的時(shí)間。 MTTR也必須包含獲得配件的時(shí)間,維修團(tuán)隊(duì)的響應(yīng)時(shí)間,記錄所有任務(wù)的時(shí)間,還有將設(shè)備重新投入使用的時(shí)間。
MTBF(Mean time between failures,平均故障間隔時(shí)間)定義為,失效或維護(hù)中所需要的平均時(shí)間,包括故障時(shí)間以及檢測(cè)和維護(hù)設(shè)備的時(shí)間。對(duì)于一個(gè)簡單的可維護(hù)的元件,MTBF = MTTF + MTTR。因?yàn)镸TTR通常遠(yuǎn)小于MTTF,所以MTBF近似等于MTTF,通常由MTTF替代。MTBF用于可維護(hù)性和不可維護(hù)的系統(tǒng)。