1.4 自动驾驶网络的总体愿景
在网络自动化、智能化的浪潮下,华为结合客户需求及技术发展趋势,提出自动驾驶网络总体愿景(如图1-7所示):通过数据与知识驱动的智能极简网络,实现网络自动、自愈、自优、自治,使能新业务并实现极致客户体验、全自动运维、最高效资源和能源利用。
图1-7 自动驾驶网络总体愿景
该愿景主要包括如下4个方面。
自动:基于用户意图业务的自动部署,最终目标是业务全自动部署。网络自动,是指根据用户业务意图,结合当前网络资源、状态和拓扑等信息,自动完成业务意图到网络内部业务请求的解析,同时,自动实现业务请求到各个部件的协同并完成设备命令的配置执行,最终实现用户业务意图部署的全自动化。
要达到上述目标,首先,需要瞄准用户业务意图的自动化达成,即将用户业务意图分解为网络意图,并基于网络意图设定实现目标,围绕目标,不断寻找和尝试可行方案,实现用户业务意图的持续、自动达成。其次,需要结合网络知识和经验实现高效、智能的自动闭环控制,即需要网络中的管控系统及设备单元能共享网络知识和经验,通过基于知识的交互提升通信效率,并结合知识和实时感知到的网络状态,智能完成闭环的决策和执行。
自愈:预测预防故障并基于事件自我恢复,最终目标是全自动运维。网络自愈,是指实现全场景的自动化运维,全自动识别或预测各类网络故障及其组合,自动利用可调度的网络资源和维修人力,采取适当的补救行动恢复业务,尽最大可能减少业务损失。网络故障处理模式由“被动”变为“主动”:原来网络被人指挥,现在变成网络指挥人完成硬件类故障维修,甚至软件类故障都不需要人,网络自己完成“维修”,实现自愈。
要达到上述目标,需要通过网络生存性仿真和高可用网络拓扑进行设计,使网络生存性满足要求。还需要基于用户业务SLA目标,根据网络状态进行实时调整,以便持续地满足用户业务的SLA。同时,事前自动防御故障、预测故障,事中保证故障自动修复及快速准确派单,事后在人的辅助下完善自愈过程,达成日常故障处理全自动运维、没有用户投诉的目标。
自优:根据用户体验自适应调整优化,最终目标是全自动优化。网络自优,是指根据用户指定目标,结合网络环境、资源、状态的变化,基于网络知识和内生内建的学习、优化算法,快速地对网络参数和资源配置进行各个层次的动态调整,逐步适应网络新的变化,最终使网络的运行达到预设的最优状态。
要达到上述目标,需要通过端到端的自主优化,激发网络潜能,为用户提供最佳体验;基于集中+分布的方式,高效利用网络资源,发挥网络最大潜能,降低网络维护成本;结合网络深度感知和环境感知,实现网络较低的能耗水平和碳排放水平,构建低碳节能的通信网络。
自治:在自动、自愈、自优的基础上,实现网络功能自演进。网络自治,是指让网络像人类一样,通过学习逐步建立对网络世界的正确认知,包括网络内外部环境的感知、网络知识的积累以及基于知识的推理,具备适应性决策能力,可解决复杂的不确定性问题,达到网络自己治理自己的目的。
要达到上述目标,需要构建自智网络系统的智能化底座,提供平台和框架,支撑完成控制闭环,实现自主的适应性决策,支撑自动、自愈、自优功能运转,最终使能新业务并实现极致客户体验、全自动运维、最高效资源和能源利用。还要通过建立认知闭环,支持知识注入和知识生成能力,实现系统的持续自学习、自演进,不断“反哺”到自动、自愈、自优能力中,从而使能网络完全自治。
华为联合TM Forum、GSMA及领先运营商共同研究和探索,发布自动驾驶网络白皮书和案例报告,对自动驾驶网络的目标、框架及L0~L5智能分级达成产业共识,逐步形成了自智网络的产业格局。
TM Forum从标准层面正式提出了自智网络愿景,自智网络旨在通过完全自动化的网络和ICT的智能化基础设施、敏捷运营和全场景服务,利用前沿技术实现“将复杂留给供应商,将极简带给客户”。此外,还需支持自服务、自发放、自保障的电信网络基础设施,为运营商的规划、营销、运营、管理等部门的内部用户提供便利。自智网络愿景如图1-8所示[6]。
图1-8 自智网络愿景
1.零等待
零等待是指自智网络能有效缩短客户等待时间,避免客户诉求长时间得不到有效处理。零等待主要体现在客户从运营商处了解、获得并使用网络业务的过程中,分阶段介绍如下。
客户了解网络业务阶段:客户根据自身需要给运营商提出业务诉求,期望运营商尽快提供可行的网络业务方案,以便了解业务详情。而当前新网络业务的TTM(Time To Market,产品上市周期)长,主要问题是由于涉及多网络专业多部门协同设计和建设、流程复杂,无法快速响应,导致客户流失。此时需要网络根据业务发展趋势,提前识别扩容需求,主动扩大网络覆盖范围,并提供灵活的跨领域编排能力,支持新网络业务快速上线运营,缩短TTM,更快获取客户认可。
客户获得网络业务阶段:客户确定购买网络业务后,期望快速投入使用。而当前网络业务涉及跨地域、跨网络专业的协同交付,介入环节多,导致总体耗时较长,影响客户的使用。此时,需要网络具备自动化的闭环控制能力,根据客户业务意图,快速开通和验收,在网络预覆盖良好的情况下,实现即开即通的极致体验。针对后期网络变更,也能即变即通。
客户使用网络业务阶段:客户在使用网络业务的过程中,期望网络稳定、质量好,对网络故障、网络质量问题期望无感知或快速自动修复。而当前如果网络出现故障,大多需要客户投诉来触发,故障受理又涉及多网络专业协同诊断、分析、修复,步骤多,导致响应慢。此时,需要网络具备故障快速自愈的能力,对于物理设备问题,能主动通过冗余资源优先满足客户需求,后续尽快通知运维工程师修复物理设备,保持可持续服务的能力。
零等待的预期目标是客户提出网络业务诉求后,自智网络能在极短时间内获得可用的服务,不再像之前需要等待超长时间。网络故障能分钟级闭环处理,对于一些成熟的业务,可以达到秒级闭环处理,即开即用,极大地提升客户的服务体验。
2.零接触
零接触是指自智网络能有效优化客户获取网络业务及保障的方式,客户不再依赖营业厅、客服及上门的运维工程师来获取网络业务及保障,可获得电商化的便利体验。零接触主要体现在客户从运营商处了解、获得并使用网络业务的过程中,分阶段介绍如下。
客户了解网络业务阶段:客户期望更便利地提出网络业务诉求,并更直观清晰地获取可选的网络业务信息。而当前新网络业务一般是客户到营业厅洽谈,由于营业厅的营业时间和营业范畴的限制,还可能需要多次前往,非常不便利。此时需要网络提供电商化的自助服务能力,能准确有效地收集客户的业务诉求,主动推荐合适的业务产品,并能够做到质量预知,给客户可承诺的保障,帮助后续业务的办理。
客户获得网络业务阶段:客户期望提出网络业务诉求后,网络业务能按要求一次性开通成功,不希望运营商不同人员反复多次沟通、上门处理。而当前网络业务一般需要人工上门处理,需要与客户多次交互,包括客户侧的资源勘测、网络安装对接、调测验收等多个环节,客户可能需要反复说明情况,多次确认和催促,并多次接待工程师上门,对客户造成不必要的困扰。此时需要网络根据业务发展趋势提前做好网络预覆盖规划,在客户提出业务开通诉求后,能一次性开通和验收,实现即开即通的极致体验。
客户使用网络业务阶段:客户在使用网络业务的过程中,期望网络故障、质量问题能自动修复,不希望运营商不同人员反复多次沟通、上门处理。而当前如果出现故障,大多需要运维工程师上门检查核对,确认问题原因后,还要再次上门修复网络,影响客户使用体验。此时需要网络具备自助维护、远程诊断、自动修复能力,对于物理设备问题,最多只需要上门一次即可解决。
零接触的预期目标是无论企业用户还是个人用户,均可以通过电商化的自助方式获取“订购/变更/维护/优化”等各种服务,极大地满足客户随时按需的服务诉求。未来提供自助的方式可以是多样化的,包括各种手机/平板类App、PC端应用或Web服务站点,甚至可以将自助界面直接延伸到客户侧的终端(如家庭调制解调器,俗称光猫)上。随着自智网络的不断演进,最终用户可以百分之百地通过自助方式获取网络服务。
3.零故障
零故障是指自智网络能有效提升对客户业务的保障,避免业务出现故障或劣化,客户对网络故障、网络质量问题无感知或感知不明显,可获得高可靠的业务体验。零故障主要体现在客户使用网络业务的过程中,具体可分为故障前、故障中、故障后3个阶段。
故障前:在网络出现故障前,自智网络能监测到网络劣化趋势,准确推测出网络可能出现的故障及对客户业务的影响,优先采取预防措施,在预防后仍存在风险的情况下,主动告知客户风险,让客户有所准备。
故障中:当网络故障无法避免、最终发生后,自智网络优先使用倒换等快速修复手段,保障客户业务不受影响,若由于特殊原因(如多路网络同时发生硬件故障)无法通过软件配置快速修复的,能第一时间告知客户影响、处理计划及给客户的规避建议,同时调度故障处理流程完成修复。
故障后:当网络故障得到处理后,自智网络需要第一时间告知客户,并做好善后工作。
这就要求自智网络能通过加强对业务、服务和基础设施的故障预测预防、质差问题预测预防、故障自动修复,实现“主动运维”,使网络性能质量能持续满足服务承诺,主动关怀客户,使用户体验超预期。如果由于任何原因出现性能劣化,网络能自动分析并决策如何优化,保障网络质量;如果有潜在的故障风险,网络能主动实时预警风险,并自动启用预案或分析可行的方案来消除风险;即使故障发生了,网络也能自行发现、自发诊断故障并修复。
零故障的预期目标是高度保障用户的网络服务,主要通过超高的业务可用率提升用户的满意度,减少用户投诉。可以预期,将来自智网络的可靠性将提升10~100倍,业务可用率普遍可以达到99.9999%。
为了更好地支撑Zero-X体验最终落地,TM Forum在自智网络白皮书3.0中提出了自智网络需具备的Self-X运营能力,如表1-1所示。
表1-1 自智网络需具备的Self-X运营能力
(续表)
由于以上范围涉及商业、交付等运营商企业强相关流程(例如自营销、能力交付),自监控/上报属于较成熟能力,本书暂不逐个展开介绍,而聚焦于自配置、自修复、自优化,后文中涉及的“Self-X”也默认为本书聚焦的自配置、自修复、自优化3个部分。
第一,自配置。自配置是指自智网络能对业务端到端部署、变更、升级提供自动化支撑,减少人工配置,并通过业务意图自动翻译为网络配置,在减少网络配置工作量、降低难度的同时,也减少人为失误带来的故障,提升业务开通和调整的效率。自配置主要体现为网络运维人员对网络进行日常维护、对客户业务申请进行部署实施的过程。
网络的日常维护(例如系统升级、扩容等)能由运维人员提前规划维护任务,系统根据维护要求,能提前做网络状态检查,并对维护任务进行仿真,确保流程动作无误后能自动快速实施,减少对网络业务的影响,事后能实时检测,评估维护任务的完成情况,整个过程再无须运维人员介入。对于客户业务的开通、变更诉求,将不再完全由客服和运维人员主导,自智网络可以自动受理客户自助发起的业务申请,并能保证业务自动成功开通、变更。
自配置的预期目标是自智网络能在运维人员不干预的情况下自动受理所有业务申请,使业务自助开通率趋近100%,并能通过规划全自动维护任务的方式,主动完成所有日常运维活动。
第二,自修复。自修复是指自智网络能在业务保障过程中进行自动化故障处理,实现故障预测预防和快速修复,保障业务高可靠运行。根据处理能力的不同,故障可分为软件类故障和硬件类故障。对于软件类故障,自智网络能自动通过软件参数调整、重置、倒换等方式自愈;对于硬件类故障,自智网络能辅助现场工程师实现问题的快速修复。自修复主要体现为网络运维人员对网络进行故障处理的过程。
网络运维人员不再时刻监控网络故障情况,只需要提前规划好各类故障的原则性策略,后期可以由自智网络自动完成对故障的监控、预防、修复等动作。针对业务纷繁复杂的故障,能寻找故障发生的规律和根因,预测预防故障发生,并自动规避故障,实现故障自动修复。
自修复的预期目标是当新业务运行一段时间后,自智网络能根据故障发生规律,不断积累故障预测预防和自动修复的知识,针对软件类故障,实现接近100%的故障自动修复率,针对硬件类故障,能辅助网络运维人员完成修复,极大缓解网络运维人员应对故障的压力。
第三,自优化。自优化是从业务质量角度进行持续的自动化优化过程,通过感知整网的业务质量情况,调整网络参数,最终满足网络优化的需求,使网络效能得到最大程度的发挥,主要体现为网络运维人员对网络进行质量优化的过程。
采用传统网络运维方式,通常在业务出现质量劣化时系统无法实时感知,而发现问题后,运维人员需要较长时间才能介入,自智网络需要从根本上解决这些问题。未来,网络运维人员不再时刻监控网络质量情况,只需要通过提前确定网络质量优化的策略性目标,即可由自智网络对业务和网络质量实现自行优化。通过对网络性能指标的实时监控,分析指标的变化趋势,结合网络质量问题出现的规律和相关运维知识,可以预测出网络即将出现质量劣化的风险,通过仿真确定可行的调优方案,自动启动优化任务,即可确保网络始终处于最优状态。
自优化的预期目标是通过网络自身的感知、智能预测和自动调优能力,实现全自动优化。自智网络需要提高对业务劣化趋势的预测,尽量提前预防劣化出现。当出现业务劣化后,自智网络能自动进行优化,无须运维人员介入,其自动优化率将逐步逼近100%。