自然语言理解与行业知识图谱:概念、方法与工程落地
上QQ阅读APP看书,第一时间看更新

推荐序二

业界一致认为,人工智能的三要素是算法、算力和数据。近十年来,得益于大数据以及大规模运算能力的提升,人工智能技术进步巨大,让深度学习这项“老”技术焕发了新生机,突破了一项又一项感知能力。随着2012年深度神经网络技术在ImageNet评测中取得令人瞩目的进展,人工智能迎来新一轮发展热潮,围绕语音、图像、机器人、自动驾驶等人工智能技术的创新大量涌现,也出现了很多里程碑式的技术。而自然语言处理领域的突破要来得更晚一些,直到2018年,以TransFormer为特征提取器的预训练语言模型开始展示出强大的能力,在阅读理解、对话、机器翻译等自然语言处理任务上才取得了良好的成绩。

从计算到感知,再到认知,是大多数人都认同的人工智能技术发展路径。所谓让机器具备认知智能,是指让机器能够像人一样思考,具体体现为机器能够理解数据、理解语言进而理解现实世界,能够解释数据、解释过程进而解释现象,并具备推理、规划等一系列人类所独有的认知能力。也就是说,认知智能需要去解决推理、规划、联想、创作等复杂任务。

让机器拥有认知智能,其实在一定程度上是希望机器能够模仿生命本身,实现通用人工智能(Artificial General Intelligence)。以大数据为基础的深度学习在理论上并没有突破,但是它基于强大的算力,通过搜索和学习,达到了以往不可能企及的应用效果。从感知到认知智能的鸿沟难以跨越,至少从现有技术水平来看,我们离认知智能还有非常远的距离。

前一段时间非常火的预训练语言模型GPT-3一度让媒体找到了新的话题,“实现认知智能”等字眼也屡见不鲜。1750亿的参数量使得GPT-3在多个任务上表现出了惊艳的效果。但GPT-3的问题在于其“并不知道自己不知道”,对很多常识性的问题给出的答案也只是“相关但不正确”。因此,即使GPT-3的表现足够让人赞叹,也只是再次证明了深度神经网络配合海量的文本数据能够产生强大的记忆能力,但逻辑和推理能力仍然是无法从记忆能力中自然而然出现的。而知识图谱可以在一定程度上解决常识推理的问题,因而被认为是通向认知智能的必经之路。

然而,现实仍然很“骨感”。在开放的互联网中语言描述的多样性、歧义性非常严重,通用语言理解任务的“银弹”级解决方案仍然难以寻找。因此,专家学者想到了两条道路:一条道路可以从顶层设计开始,基于演绎逻辑打造囊括大千世界的知识本体及世界知识库,这类方法极其依赖专家经验、规模化众包协作、复杂建模,这条路目前看起来相当困难;另一条道路可以基于归纳逻辑从海量样本中抽象出认知概念,这条路也因为难于实现概念标准化、规范化,缺少合适的工具或方法,因此仍处于学术研究阶段。

两条道路都是任重而道远。即便是知识图谱被寄予厚望,也无法在短期时间内实现认知智能的真正突破。因此,在工业界的实践中知识图谱能否发挥其作用,在行业或者细分领域达到较好的效果,就成为漫长道路上可以实现的里程碑。

本书为广大从业人员和研究学者提供了一个新的视角,基于真实的细分行业需求,在约束的条件下,通过知识图谱相关理论、方法和技术向各行各业赋能,推动语言理解成果向行业的转移转化,更具有落地实操的价值。如何围绕行业需求,结合行业知识构建知识图谱,将自然语言处理与知识图谱更好地融合,直击垂直行业落地应用的痛点,是本书重点关注的内容。

本书是作者几年来在自然语言处理和行业知识图谱实践中的经验梳理,无论你是人工智能领域的从业者还是科研领域的研究者,这本书都能够带给你非常有价值的知识体系和实操方法。

邵浩

vivo算法专家