第1章 故障预测与健康管理技术概述
1.1 故障诊断、预测与健康管理技术的发展历史和演变
故障预测与健康管理(Prognostic and Health Management,PHM),顾名思义,包含两层含义:一是故障预测,即预先诊断部件或系统完成其功能的状态,确定部件正常工作的时间长度;二是健康管理,即根据诊断/预测信息、可用资源和使用需求对维修活动做出适当决策的能力。
健康管理的基本思想起源于健康监测,最早应用在20世纪70年代中期美国A-7E飞机的发动机监测中。从飞行器综合健康管理(Integrated Vehicle Health Management,IVHM)[1]、综合系统健康管理(Intergrated System Health Management,ISHM)[1]、故障预测与健康管理的出现,到飞机健康管理(Airplane Health Management,AHM)和飞机状态分析与管理系统(Aircraft Condition Analysis and Management System,ACAMS)等理论与系统技术的出现和应用,复杂系统的健康管理技术不断发展,近年来其功能已经从风险监测和故障预防,发展到精确风险控制、风险决策和集成优化的高度。例如,美国国防部提出的增强视情维修(CBM+)、欧洲 12 个国家完成的新维修概念的技术与技能(Technologies and Techniques for New Maintenance Concepts,TATEM)等,这些都对复杂系统健康管理中的可靠性评估和寿命预测技术提出了更高的要求。
PHM 技术的演变过程是人们认识和利用自然规律过程的一个典型反映,即从对故障和异常事件的被动反应到主动预防,再到事先预测和综合规划管理。
在20世纪50年代和60年代,航空航天领域极端的环境和使用条件驱动了最初的可靠性理论、环境试验、系统试验及质量方法的诞生。随着宇航系统复杂性的增加,由设计不充分、制造误差、维修差错和非计划事件等各种原因导致的故障概率也在增加,迫使人们在20世纪70年代创造出新的方法来监视系统状态,预防异常属性,从而导致机上关键故障响应方法的出现,如故障保护和冗余管理。随后出现了诊断故障源和故障原因的技术,并最终带来了故障预测方法的诞生。流行于20世纪80年代后期和90年代早期的全面质量管理(TQC)是一种基于过程的质量与可靠性保证方法,同时,软件工程师也创造了更为复杂的软件测试技术来检测软件设计缺陷。20世纪90年代初期,“飞行器健康监控(VHM)”一词在NASA研究机构内部盛行,它是指适当地选择和使用传感器和软件来监测太空交通工具的“健康状态”。工程师们不久发现,VHM 这个术语存在两方面不足。首先,仅仅监控是不够的,真正的问题是根据所监控的参数采取什么措施。“管理”一词不久就代替了“监控”来指这一更活跃的实践。其次,考虑到飞行器仅仅是复杂的人-机系统的一个方面,“系统”一词很快代替了“飞行器”,因此,到20世纪90年代中期,“系统健康管理”成为涉及该主题的最通用的词语。美国国防部在同一时期产生了一套涉及类似主题的过程,但冠以“综合诊断”的名称。综合诊断通常定义为通过考虑和综合测试性、自动和人工测试、维修辅助手段、技术信息、人员和培训等构成诊断能力的所有要素,使装备诊断能力达到最佳的结构化设计和管理的过程。其目的是以最少的费用最有效地检测、隔离武器装备内已知的或预期发生的所有故障,以满足装备任务要求。综合诊断从20世纪80年代后期至90年代在美国国防部和三军中盛行,并在美军新一代武器装备,如F-22战斗机、F-35(JSF)、M1A2主战坦克和SSN-21攻击核潜艇研制中得到采用。此后不久,NASA 引入了类似的术语,即 ISHM。在 NASA 术语中使用“综合(Intergrated)”一词的动机在于:解决将“系统级”与各个不同分系统分割开来的问题。以往各个分系统都是在其各自学科领域内处理各自的故障问题,没有从系统的角度加以全面、综合的考虑。通过强调从系统的角度考虑问题,有助于将 ISHM 限定为一种新的系统问题,代替过去将注意力放在分系统上。
20世纪90年代末,随着美军重大项目F-35联合攻击机(JSF)项目的启动,为PHM 技术的快速发展带来了契机。PHM 是JSF项目实现经济承受性、保障性和生存性目标的一个关键所在。JSF 的 PHM 系统是对当前飞机上使用的机内测试(BIT)和状态监控的发展。这种发展的主要技术要素是从状态(健康)监控向状态(健康)管理的转变。这种转变引入了故障预测能力,借助这种能力从整个系统(平台)的角度来识别和管理故障的发生。其目的是减少维修人力,增加出动架次率,实现自主式保障。美国国防部和 NASA 在 PHM/ISHM 相关技术方面的演变过程见表1-1[24]。
表1-1 PHM/ISHM技术演变过程