我们赖以生存的意义
上QQ阅读APP看书,第一时间看更新

推荐序二 具身模拟,自然语言实现飞跃的关键

李航

字节跳动人工智能实验室负责人

认知科学家本杰明·伯根所著的Louder than Words,由人工智能专家宋睿华和作家兼记者王尔山翻译成中文,译名为《我们赖以生存的意义》,并由湛庐隆重出版。在此,谨向两位老师表示祝贺!

具身认知是近20年来兴起的认知科学学说,它认为人的身体是感知和认知的基础,身体的体验对感知和认知起着决定性作用。具身模拟假说(embodied simulation hypothesis)是其中关于语言学的部分,认为语言理解是人在心智中基于自己过去的视觉、听觉、运动等体验进行的模拟。具身模拟假说拥有大量认知科学、脑科学、语言学等学科的实验结果作为支持,已经成为解释人类语言理解机制最具说服力的科学理论,并逐渐对人工智能、语言学、脑科学、心理学、社会学等领域产生了巨大的影响。

伯根教授是具身模拟理论研究的领军人物之一。他面向一般读者总结了具身模拟理论的研究成果,让读者能对整个领域有一个全面深入的了解。本书通过大量的心理学、脑科学、语言学实验结果,论证了人是如何使用视觉、听觉、运动等方面的心智功能进行想象和模拟来理解语言的,并分析了个人体验、文化背景对语言理解的影响,人类理解语言的过程,语法在语言理解过程中的作用,抽象概念理解的特点等重要问题。行文立论严谨,讲解清晰,描述生动。书中讲述的北极熊、会飞的猪、黄色的卡车司机帽等例子都会给读者留下深刻印象。

宋睿华老师在机器人对话和写作方面做出了业界领先的研究成果,王尔山老师是有广泛影响的资深记者,也是多部畅销著作的译者,两位老师可以说是珠联璧合,是本书翻译工作的绝佳人选。本书译文通顺流畅,准确贴切,是一部难得的上乘佳作。

我从事自然语言处理等领域的研究多年,一直关注以乔治·莱考夫为代表的具身认知学派的发展,受其影响颇深。约翰·泰勒(John Taylor)的《语言的范畴化》(Linguistic Categorization)、莱考夫的《女人、火与危险事物》(Women,Fire,and Dangerous Things)、莱考夫与马克·约翰逊(Mark Johnson)合著的《我们赖以生存的隐喻》(Metaphors We Live by)等书都曾使我产生顿开茅塞之感,对我都产生了重大影响。阅读本书,又让我对人的语言和认知的本质产生了更为深刻的认识。书中介绍的很多理论及其解释都耐人寻味,发人深思。相信也会为我今后的工作提供参考依据,加深知识,增强见解,带来灵感。

自然语言处理是研究和开发在计算机上实现人的语言理解能力和生成能力的人工智能领域。具身模拟理论给我们的最大启示是:自然语言处理需要结合视觉、听觉、运动处理机制才能实现更好的机器翻译、知识问答、语言对话、写作支持等应用。目前为止,人工智能的研究都是在视觉、听觉、运动、语言等不同的子领域中相对独立地进行的。现在人工智能的各个领域都在使用深度学习技术,方法都是相通的,这同人的认知处理机制的基本原理相似而处理信息不同有异曲同工之处。可以预见,基于视觉、听觉、运动、语言等多模态的深度学习将是未来自然语言处理的核心技术。

具身模拟理论的一个假设是:人对语言的理解离不开身体与外界环境的互动,只有通过身体的视觉、听觉、运动等方面的经验积累才能实现对语言的理解,因此,有人认为脱离身体的语言理解是不可能实现的。在我看来:人工智能或自然语言处理的终极目标不应该是模仿人类,而应该是为人类提供有用的工具。从这个意义上来说,我们没有必要完全复制人类的语言理解过程,实际上,参考人类的处理机制,实现接近人类的语言处理能力应该就已足矣。

总之,这是一本值得阅读的好书。我特别向在人工智能、语言学、脑科学、心理学、社会学等领域工作的人们强烈推荐,相信这本书会给大家带来很多启发和帮助。