引言
从1876年亚历山大•格雷厄姆•贝尔发明电话算起,通信网络的发展已经历了近一个半世纪的时间。发展到今天,一方面,通信网络已经深度融入人类社会生活、工作的方方面面,我们每时每刻都在享受着通信网络服务,以及基于通信网络衍生出来的各种互联网应用服务。通信网络除了提供语音通信、网络购物、移动支付、视频直播、在线教育、远程医疗等个人消费类服务,还成为电力、金融、制造、能源、政务、医疗、教育、交通、化工等诸多领域的信息基础设施。通信网络与人类社会的融合程度如此之深,以至于我们几乎感受不到通信网络服务的存在,或许只有在服务出现中断的时候,我们才意识到它的不可或缺。另一方面,支撑这些通信网络服务的,是一个如此复杂的网络。据不完全统计,截至2022年底,全球运营商已部署无线宏基站物理站点超过700万套,逻辑站点超过1000万套,IP核心设备超过3万套,IP汇聚设备超过20万套,IP接入设备超过100万套,OTN(Optical Transport Network,光传送网络)骨干设备超过15万套,OTN城域设备超过26万套,OTN接入设备超过7万套。特别的,如此庞大的网络系统,约80%是在过去20余年内建设起来的。以中国的移动通信网络为例,这20余年,它跨越了2G、3G、4G、5G四代移动通信技术,直到今天,这四代移动通信网络技术依然在共同服务社会。而且,整个社会对通信网络的需求升级从未停止,未来也不会停止,移动网络、光网络、数据通信网络等正在进入5.5G、F5.5G和Net5.5G的发展阶段。无论从技术跨度还是从规模跨度考量,20余年的发展实在太快,没有足够的时间停下来彻底优化,也没有足够的时间很好地消化技术变革。而快速发展的代价就是网络自身变得越来越复杂,积累下来,对运营商业务的发展形成越来越大的挑战,最为突出的表现在如下3个方面。
首先,业务敏捷和持续创新带来的挑战。网络技术快速发展,给运营商带来新一轮丰富的新业务发展机会。面向消费者的大带宽低时延XR(eXtended Reality,扩展现实)业务、居家+公司混合办公业务、线上+线下远程教育高质量视频业务,以及面向工业领域的高可靠低时延移动专网业务,都正成为运营商的未来业务和收入增长点。适应数字时代的发展节奏,加快创新速度,快速采用新技术,快速推出新业务,在赢得新机会的竞争中胜出,已经成为很多运营商的发展战略。在新建网络上实施业务创新相对容易,而现实是通信网络同时还要支持很多复杂的历史存量业务,多代技术构成的历史遗留网络会与新建网络长期共存,如2G、3G、4G和5G网络共存。实际网络中的业务创新必然会涉及存量网络和业务的大量改动,牵一发而动全身,这不仅制约了创新的速度,也影响了创新的成功。
其次,按需实时保障用户体验带来的挑战。未来5~10年,新型智能化终端会更进一步地快速发展,无人机、VR/AR(Virtual Reality/Augmented Reality,虚拟现实/增强现实)眼镜、机器人等消费终端,以及AGV (Automated Guided Vehicle,自动导引车)、医疗设备、重型机械等数字化行业终端,对用户体验的按需实时保障提出更高要求。通信网络是个性化突出的公共基础网络,具有用户千人千面、设备千站千面的特点。同时,它还是时变的超复杂系统,即用户需求和分布持续变化,环境和设备状态持续变化,持续地升级、扩容、改造,新业务开通和变更持续进行。网络时变的复杂性可能使得一些人的体验变好的同时,另一些人的体验变差,并由此带来用户体验感知跨度大、度量难的问题。目前,只能做到后分析、平均统计的被动式响应,难以满足用户按需精准实时保障的体验诉求,更难以达到运营商期望的预测性处理和主动式响应,且需要将成本控制在可接受范围内。实现对各种类型终端和应用的精准感知,实现SLA(Service Level Agreement,服务等级协定)可保障,提升用户体验和黏性,是通信网络未来的关键创新方向。
最后,网络运维面临架构、流程和人员能力的多重挑战。过去20年,网络不断升级,但运维体系没有发生显著的变化。一方面,通信网络是基础服务,要一直支持存量旧业务,不能随意中断、中止用户服务。网络复杂度的增加带来的运维复杂度逐渐超越人的能力范畴,已经不能依靠线性地增加维护人员来应对网络维护的挑战。另一方面,多样化业务不断创新,也要求网络运维过程以及运维人员能力与之匹配,运维人员需要学习新技能,以适应网络新业务发展需要。而复杂的网络让这一学习过程变得更具挑战性,学习周期也更长。通信行业人员更迭的速度在变慢,这使人才技能空缺的挑战变得更大。同时,缺少网络业务和运维专家的主导,以单纯IT(Information Technology,信息技术)的思路应对网络运维变革和改造,难以有效把握复杂场景和业务诉求,很难取得深入和突破的效果。网络运维当前面临架构、流程和人员能力的多重挑战,成为制约网络进一步发展的重要瓶颈因素。
这些挑战并不是某一天突然出现的,整个通信行业一直在努力应对这些挑战。自2006年起,华为先后提出了基于All IP的FMC(Fixed Mobile Convergence,固定移动网络融合)架构,以及基于Single战略的一系列解决方案,旨在帮助运营商简化网络、降低OPEX(Operating Expense,运营成本)。自2011年起,华为又先后提出了基于Cloud的SoftCOM架构,以及基于All Cloud战略的一系列解决方案,旨在帮助运营商提升用户体验,实现ROADS目标,即Real-time(实时)、On-demand(按需)、All-online(全在线)、DIY(自服务)和Social(社交)。现在回顾一下,在各个阶段,这些架构性创新在应对解决通信网络的重大挑战上都发挥了积极的作用。但也要注意,当时设想的目标都还没有完全实现,仍在实现的过程中,而这也揭示了通信网络的复杂性和应对挑战的艰巨性。
AI的发展为我们解开这些难题开辟了新的路径。传统的通信网络是基于专业人员制定的规则和模型运行的,也基于这一体系不断修补,发展到今天,传统通信网络越来越难以适应网络和业务体验的复杂性、网络环境的不确定性。而AI以数据为中心的机器学习模式,是完全不同于规则系统的一种全新的思维模式,对解决复杂系统问题具有独特优势。从2017年开始,华为提出SoftCOM AI设想,旨在将AI引入通信网络;2018年提出自动驾驶网络架构理念,致力于实现“自动、自愈、自优、自治”(“四个自”)的长期愿景,使能新业务并实现极致客户体验、全自动运维、最高效资源和能源利用。“自动”即基于用户意图业务的自动部署,最终目标是业务全自动部署;“自愈”即预测预防故障并基于事件自我恢复,最终目标是全自动运维;“自优”即根据用户体验自适应调整优化,最终目标是全自动优化;“自治”即在自动、自愈、自优的基础上,实现网络功能自演进。从客户角度,主要体现为“零等待、零接触、零故障”的客户体验;从运营商规划、建设、维护等运维人员角度,主要体现为“自服务、自发放、自保障”的网络运维体验,也就是行业所称的“三零三自”。过去5年多的时间里,我们把人工智能成功应用于100多个通信网络场景,在体验保障、故障管理、网络节能等领域取得了一些突破,验证了人工智能在通信领域的独特价值。基于这些创新实践,在2022年秋,华为发布了Intelligent系列解决方案。同时我们也认识到,通信网络是一个巨大的复杂系统,存在很多独特的场景和技术挑战,如移动网络、光网络和数据通信网络的专业领域业务以及技术差异,面向地理和人口分布的广域覆盖差异,面向用户的移动性与流量变化差异。这些挑战随着时间的累积,还会进一步交叉和混合,问题解决难度进一步增大。更重要的是,通信网络是基础设施,需要始终保证全程全网的正常工作,任何局部的问题都可能引发全网故障。
我们认为,要在复杂性如此巨大的通信网络系统中真正实现人工智能的价值,解决通信网络面临的重大挑战问题,需要在AI和通信网络技术方向上持续展开跨领域的基础理论、网络架构、关键技术和算法以及商业模式的研究创新。而这些需要学术界和运营商、设备商等工业界的共同努力。我们把华为的最新研究进展整理成这本书,分享给业界,希望可以让更多学术研究者、行业专家投身这一领域,促进自动驾驶网络愿景的早日实现,从而推动通信行业的持续健康发展。
党文栓,华为技术有限公司首席战略架构师