自然语言理解与行业知识图谱:概念、方法与工程落地
上QQ阅读APP看书,第一时间看更新

第2章 自然语言理解逻辑

上一章我们简要介绍了自然语言理解的“机器认知-人类交互需求”层次,本章将结合符号和连接两种处理逻辑,具体介绍自然语言理解实践中的任务层次,进一步归纳出一套理解体系。在语言的理解上人类和机器是可以类比的,我们可以设想这样一个理解过程:人类通过视、听觉等得到感应,通过中枢神经系统的控制完成响应。对机器而言,传感器接收信号作为输入,继而给出输出反馈,从而形成指令。如果模仿人类行为的话,可以通过控制系统来执行,看是否与人类的理解相符。在这个过程中,从信号输入到输出反馈就是语言理解的过程。与图像、语音信号的连续性不同,自然语言符号存在离散性、组合性和稀疏性等特点。特别是语言的组合性,能够形成多种合法序列和不同层次的理解。因此,机器首先面临的问题就是输入自然语言的处理,之后才能进一步语义理解。自然语言处理(理解)可以追溯到20世纪50年代,是一门融合了语言学、计算机、数理统计及认知学等领域的交叉学科。基于不同的哲学理解方式,产生了基于规则的理性主义(符号主义)和基于统计的经验主义(连接主义)两种方法。今天,理性主义和经验主义再次站到了一起。下面我们将详细论述。