上QQ阅读APP看书,第一时间看更新
十、本章总结
这一章我们讨论人类自然语言共有的特征。因为自然语言的演化遵循着一些基本逻辑,所以根据这些基本逻辑,不同类型的自然语言会演化出共有特征,这些特征导致了AI自然语言处理的难度。
1.如果一个概念没有名称,就需要用其他方式去指向;如果概念本身是一个结构信息,我们就可以通过组成结构信息的元素去指向这个概念,比如对事件概念的陈述;如果概念存在于一个结构信息中,我们就能用结构信息去指向这个概念,这就是从句的来源;如果用以指向一个概念的元素自己也没有名称,我们就需要先设法指向这个元素,于是就形成了多重嵌套的表达。
2.人类在听一个人的讲话、读一本书,或是自己在讲话,或是对话状态,都会在语言处理过程中保存特定的信息,最短期的记忆比如最近谈及的对象、属性、事件、事件规律等,这些信息让我们创造表达的省略,读懂对方表达中的省略。较为长期的记忆,比如一大段表达中每个信息被重复的次数,这让我们知晓逻辑不那么清晰的表达的重点;表达的信息之间的相互关系,能让AI听到的不再是局部的碎片化的信息,让AI能够带有整体感地复述一大段表达。
3.表达省略分为两种类型——语境省略和常识省略。语境省略也就是因为语境保持了信息,所以可以省略;常识省略也就是因为常识中包含了信息,所以可以省略。省略机制让语言在不会导致误解的前提下变得简洁。
4.人类的表达很少是精确的,无论是语法上,还是逻辑上;人类也极少会通过精确的定义去掌握某一词汇。事实上造物主给予人类的自然语言就是建立在不精确和模糊之上的艺术品。从词汇的掌握到词汇的使用,很多都是在意向层面的工作。