1、計算機可靠性介紹
計算機的硬件故障通常都是由于元器件失效造成的。元器件的可靠性分為三個階段:開始階段元器件處于不穩定階段失效率比較高、第二階段是正常工作階段,失效率最低、第三階段元器件開始老化,失效率就又開始提高。又稱為“浴盆曲線”。
計算機的可靠性:從 開始運行t=0到某時刻t這個時間段內,可以正常運行的概率。
失效率:單位時間內失效的元件數與元件總數的比例。
可靠性與失效率的關系:
? ? ? ? ? ? ?
平均無故障時間(MTBF):兩次故障之間正常工作的時間平均值。
公式:MTBF=1/λ
平均修復時間(MRBF):表示計算機的可維護性,指從故障發生到機器 修復的平均時間。
公式:A=MTBF/(MTBF+MTRF)
RAS:可靠性R、可用性A、可維修性S三個指標來衡量計算機系統。
2、計算機可靠性模型
2.1 串聯系統
當一個系統有N個子系統組成,當所有的子系統都能正常工作才能正常工作。這種系統成為串聯系統。
系統的可靠性R度量值=R1*R2*...Rn
失效率
λ=λ1+λ2+λ3+..+λn
2.2 并聯系統
當一個系統有N個子系統組成,只要有一個子系統可以正常工作,系統就能正常工作,這樣的系統成為并聯系統。
系統的可靠性R度量值=1-(1-R1)*(1-R2)*(1-R3)...(1-Rn)
系統失效率公示
? ? ? ? ? ? ?
在并聯系統中只有一個子系統是有效的,其余n-1個子系統成為冗余子系統。
2.3 N模冗余系統
N模冗余系統由N個(N=2n+1)相同的子系統和一個表決器組成,表決器把N個子系統中占多數相同結果的輸出作為系統輸出。
? ? ? ? ? ? ? ? ? ? ?
? ? ?
3、提高系統可靠性方法
1、提高元器件質量、改進加工工藝和工藝結構。
2、發展容錯技術,使得計算機硬件有故障的情況下,仍然可以運行。