新基建:数据中心规划与设计
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

4.2 可靠性参数

可靠性是什么?如何正确描述一个系统的可靠性?不同的人提出了不同的定义和参数,目前还没有一个统一的定论,但大家普遍公认的定义是1952年R. Lussen在San Diego的一次论坛上首次提出的概念。

1953年,Richard R. Carhart对它进行了概括:可靠性是指系统在一定的条件下,在一定的时间区间内完成预定功能的能力。因此它有3个要素:不同的条件、不同的时间和不同的功能。在不同的发展阶段,人们对系统可靠性关注的角度不同产生了不同的描述系统可靠性的参数,主要有可靠性(Reliability)、可维性(Maintainability)、可用性(Availability)和保能性(Performability)等。

1. 可靠度和不可靠度

可靠度Rt)主要从一个系统能够正常工作的时间长短来描述系统的可靠性。其定义为系统在t0时刻正常工作的条件下,在[t0, t]时间区间内正常工作的概率。

Rt)=P{X > t}

不可靠度Ft)为

Ft)=1−Rt

它主要应用于不可修复或极难修复的系统(如卫星系统)等。在可靠性发展的早期阶段人们主要应用可靠度来衡量系统的可靠性指标。

2. 可维性和可维度

随着可维修系统的出现和大量应用,人们又提出了可维性的概念。可维性是衡量系统发生故障时维修难易程度的一种指标。其定量测度称为可维度(系统失效后在时间间隔t内被修复的概率),记为Mt)。

Mt)=P{Xt}

3. 可用性与可用度

可靠性与系统的生存周期有关,而维修性与系统的维修有关。1982年,Tillman等通过把这两者结合起来创造了一类反映系统有效性的参数,这就是系统的可用性(在时刻t系统正常工作的概率)。

稳态可用度Ass作为系统连续工作的度量,平均可用度作为系统在一定周期内的度量。

对于不可维修系统有At)=Rt)。

4. 保能性和保能度

保能度是保能性的度量指标。保能度PL, t)的定义是系统在时刻t其性能保持在L级或L级以上水平的概率。它是把性能与可靠性结合起来的一项指标。其中,引入了部分失效的概念,系统发生一定的故障,但并不影响系统的运行,只不过系统性能下降到一定的等级。特别是电信工业中提出QoS(Quality of Service)以来,保能度的研究越来越受到重视。

保能度和可靠性的一个重要区别是:可靠性是衡量系统能够正确执行全部功能的可能性的一种指标,而保能度则是衡量系统能正确执行最低限度部分功能的可能性的一种指标。

5. MTTF、MTTR、MTBF

MTTF、MTTR、MTBF是3个简化的可靠性参数分别为平均故障前时间(Mean Time To Failure,MTTF)、平均维修时间(Mean Time To Repair,MTTR)和平均故障间隔时间(Mean Time Between Failure,MTBF)。它们三者之间的关系如图4-1所示。

图4-1 MTTF、MTTR、MTBF的关系

由图4-1可知,MTBF=MTTR+MTTF。