自然语言理解与行业知识图谱:概念、方法与工程落地
上QQ阅读APP看书,第一时间看更新

小结

自然语言理解任务是以任务为导向,以语言表示为基础,以语言特征工程为出发点,以算法模型为核心的“问题-解决”系统。本章首先介绍了自然语言处理的历史演进脉络,进而讨论了目前自然语言处理领域的基本任务:从语法学、语义学和语用学角度给出了自然语言理解任务的基础知识,最后给出了自然语言理解的体系框架,为后续自然语言处理算法和知识图谱的介绍奠定了基础。

语用类任务种类繁多,本章仅仅介绍了少数常见的语用任务,不同行业(领域)会衍生出各种特定的应用任务。对语言任务进行逐层分解,不同层次的任务采用不同的方法或方法组合来解决。根据自然语言处理的算法和模型,设计浅层机器学习模型、深层串联流水线模型、端到端的模型等予以解决。随着可解释需求的日益增多,为问题匹配相应的知识图谱子图(对应解释匹配),提升语义和语用任务的效果。这部分内容将在第3章和第4章中详细介绍。进一步将算法模型向上封装,形成满足任务的服务、工具甚至平台。

本章是全书的基本出发点,概述了自然语言理解的基本逻辑。下一章,我们将对各类任务相关的自然语言处理核心方法进行具体介绍。