计量语言学研究进展
上QQ阅读APP看书,第一时间看更新

3.4 讨论

3.4.1 实证性检验结果

经过验证,协同模型的4对直接关系假设,全部得到了汉语实证数据的支持,其中多义度假设PL=aLb和频率假设F=aPTb的验证取得了非常好的结果,拟合度分别为0.9480和0.9790;多文度假设PT=aPLb虽然拟合度较低,R2=0.7864,但其趋势仍然符合幂律;唯独词长假设L=aFb拟合度极低,只有0.3515,这是由于数据点的波动现象(围绕理论曲线产生一定幅度偏离)造成的。其一,该现象不能通过移动平均线消除,说明这不是偶然现象,而是语言系统本身的特性;其二,该现象不单单存在于汉语中,在德语(Köhler,1986)、波兰语(Hammerl & Sambor,1993)、英语(Gieseking,1998)等研究中也发现了类似现象,再一次确定了其非偶然性,这不是汉语独有的,而是普遍存在于语言系统的、语言自身的特性。

模型的间接关系和双倍间接关系(反向关系)也被纳入研究,以便更彻底地检验模型。4对间接关系中,只有PL=aFb的理论参数和实证参数存在显著性差异,但参数符号一致。4对双倍间接关系中,3对存在显著性差异,但每对关系的理论、实证参数符号均保持一致。鉴于部分实证方程本身取得的拟合度并不高,即使T检验得到显著性差异的结果,也不足以推翻模型假设。如果词汇结构中存在某些独立变量是协同模型未考虑到的,则会出现理论参数与实证参数符号相反的情况。检验结果表明,所有理论参数与相应的实证参数符号均一致,所以我们认为,模型假设是可以接受的。

3.4.2 讨论

此前的研究,主要目的集中在模型的验证成功与否,本研究在模型得到了汉语数据支持的基础上,进一步提出新的视角,即属性的分类、关系的分类,以及系统所处的状态,以此进行更深入的讨论分析。

A.静态与动态

模型具有4个核心属性:多义度、多文度、频率、词长。一方面,词长和多义度可从词典信息中提取,不依赖于动态文本,属于静态属性,它们代表着词汇的两个基本层面——发音和意义。另一方面,频率和多文度只能从动态文本、语料库中提取,它们反映的是词汇的动态应用。

现在我们从这一角度分析验证结果:多义度假设PL=aLb可视为一个静态属性作用于另一个静态属性,同理,频率假设 F=aPTb可视为两个动态属性之间的作用,这2对“同源”关系都得到了完美的拟合结果,拟合度分别为0.9480和0.9790;而多文度假设PT=aPLb则是静态属性作用于动态属性,词长假设L=aFb是动态属性作用于静态属性,这2对“混合”关系的拟合度不十分理想,分别是0.7864和0.3515。由此可见,较之混合属性的关系,同源属性之间的关系更为紧密。

两种混合关系,静态属性作用于动态属性(静→动)、动态属性作用于静态属性(动→静)也存在一定区别,前一类型取得拟合结果优于后者,而且后一类型的关系对,无论直接关系还是间接关系,均出现了数据点围绕理论曲线波动的现象。具体来说,包括L=aFb, L=aPTb, PL=aFb, PL=aPTb这4对关系。可见,静态属性对动态属性的决定性作用强于其反方向作用。所有关系对及其方程见表3.9。

表3.9 属性关系的分类

B.反映与调试

实际上,静态属性作用于动态属性(静→动)是一种反映关系,即动态属性在实际应用中反映静态属性的特点。动态属性对静态属性(动→静)却不是一种简单的决定作用,它涉及语言系统自身的调节机制。

语言是心理—社会、生物—认知现象(Köhler,2005),随着语言外部世界的发展,人类的语言行为也会改变。同时,语言作为一个系统,具有自我调节机制,这个系统的平衡状态被打破时会触发其自身的补偿行为以达到一个新的平衡稳态。这套机制也反映在语言的子系统——词汇层面:词汇的动态属性最先产生变化,引起词汇变化,改变词长和多义度,但系统本身会抗拒改变以确保传输准确性,并保持词库大小不变。其表现是一个负面反馈作用,并且这个反馈在调节过程中总是滞后出现。

以上分析解释了动→静关系中数据点出现波动的原因。显然波动是由系统自身调节行为造成的,也是语言作为自适应自调节系统的一项特性,所以扩大样本、移动平均法都不可能彻底消除这个现象。

C.共时与历时

协同语言学也从历时观点研究语言,然而在一个具体的实证性研究中,我们只能获取共时数据,因此,我们所能观察到的,是语言历时发展的一个横截面,在时间维度的这一个时间点,语言作为一个动态系统,正在调解它自身(或自身的一部分)以期达到稳态。这也从另一个角度解释了为什么词汇系统一部分相对波动,而其他部分相对稳定。