汉语组合范畴语法研究:基于交叉学科的视角
上QQ阅读APP看书,第一时间看更新

1.1 古典范畴语法

古典范畴语法简称范畴语法,它是一种体现运算思想的描述语言的形式化工具。范畴语法的基本做法是从不同层次的语言表达式中抽象出句法范畴,并通过范畴的运算去刻画语言由小到大逐层逐级的毗邻生成。范畴语法的思想来源于弗雷格的语句函项观点以及罗素和列斯尼维斯基提出的分层思想,由爱裘凯维茨开创,巴-希勒尔推广。

1.1.1 范畴和运算

范畴语法的函项运算思想根源来自弗雷格。弗雷格把数学的函项概念扩展到语言研究,把语句看作函项运算的产物,而不像语言学家那样,把语句分析成主语与谓语。在弗雷格看来,一个自然语言表达式能够被分析成函项与论元的关系。其中哪部分是函项,哪部分是论元,取决于满足所谓恒定不变性质。恒定不变的部分就是函项,可变的部分就是其论元。例如,“John walks”可以分成两部分:“John”和“walks”。从某种角度来讲,可以把第二部分看作恒定不变的,具有“不饱和”(unsaturated)性质,包含一个空位,只有空位中填上一个专名,才能获得完整句子。据此,第二部分就可以看成函项,而第一部分是一个专名,两部分联结在一起就是一种函项运算,“walks”所代表的函项对“John”所代表的论元进行运算,这就是范畴语法的基本思想。

自然语言具有生成毗连性,这是范畴语法的切入点,在范畴语法看来,这种毗连生成就是一种函项运算。为了展现这种函项运算,需要确立自然语言表达式的类别,有些类别作为函项,而另一些类别则是函项运算的主目。这些不同类别需要相应的标记,范畴就是这样的标记。例如,范畴S表示句子,范畴NP表示名词短语或者专名。范畴语法的任务就是通过范畴之间的运算来刻画自然语言的毗连生成。

自然语言的毗连性和类别性类似语言学家索绪尔的双轴理论所说的语言的组合关系和聚合关系,毗连性就是组合关系的体现,而语言的类别则是聚合关系的产物。通常语言学在讨论词法句法的分类时,也使用句法范畴的概念。范畴是对若干特列抽取概括的结果,如名词范畴是对若干具体名词的抽象。

类似“共时语言学”的做法,范畴语法具有体现哲学家胡塞尔所谓互相置换思想的定义:

表达式0和表达式1属于同一个句法范畴,当且仅当,把某个合法的句子中的0替换1所获仍是一个合法的句子。

范畴运算必须涉及函项和论元的概念。通常把NP和S看作原子范畴,带斜线“\”和“/”的范畴是派生范畴。派生范畴也叫函子范畴(factor category),用B/A和A\B表示。相对B/A和A\B而言,A是论元范畴(argument category),B是取值或者结果范畴(range or result category)。

函子范畴与通常函项算子不同之处包括:

(1)函子范畴具有运算的方向性。B/A称作前向(forward)的函子范畴,其主目范畴A在右边出现,函子范畴从左到右向前对论元范畴进行运算。A\B称为后向(backward)的函子范畴,其主目范畴A出现在左边,这时候函子范畴从右到左向后运算。

(2)函子范畴的写法表明其论元范畴和取值范畴分别是什么。

1.1.2 形式化描述

定义1-1 范畴语法£为一个六元组:

£=(VCat,BRcRoI

其中:

V是词库。

Cat:范畴集合。

B:{S,NP}是基本范畴。

Rc:范畴递归生成规则。

Ro:范畴运算规则。

IVCat 是对词的范畴指派(这种指派并不唯一)。

定义1-2 范畴递归生成规则 (Rc

1.S,NP是原子范畴

2.如果A,B是范畴,那么A\B和B/A也是范畴

定义1-3 范畴运算对应语言表达式毗连的句法规则 (Ro

1.B,B\A⇒A

2.A/B,B⇒A

假设我们进行一个范畴指派,其具体指派如表格1所示。

表格1 古典范畴语法中的范畴指派

续表

按照上述规则和指派,我们可以得出以下的示例。

(1-1) John walks quickly.

(1-2) Poor John walks.

(1-3) John loves Mary.

(1-4) John gives Mary an apple.

(1-5) Poor John loves lucky Mary.

从自然语言的类别和毗连现象出发,即在自然语言的聚合和组合关系的基础上,概括出范畴和运算的思想。古典范畴语法主要关注自然语言句法层面的情况,给自然语言的词条指派一定的范畴,通过函子范畴对主目范畴的运算,展现了自然语言由小到大逐层逐级的句法生成。从逻辑的视角,古典范畴语法可以在以下两个方面有进一步的发展。一方面,从自然语言抽象出的范畴及其运算规律可以构成类似蕴含命题逻辑那样的形式系统,甚至可以给这样的系统建立可能世界语义理论。另一方面,通过句法范畴和逻辑类型的对应,把自然语言句法层面的表达式翻译成高阶逻辑式,从而在自然语言的语义层面建立一种形式语义解释。

与乔姆斯基学派的理论相比较,范畴语法显示出自己独有的特点,从结构角度看和逻辑类型论有严格的对应关系,并且适合计算机自动分析。