上QQ阅读APP看书,第一时间看更新
第二节 汉英平行语料库与翻译
一般认为,平行语料库(parallel corpora)和可比语料库(comparable corpora)都可用于对比研究, (6) 但二者的优劣明显不同。 (7) 前者既包含原语文本,又包含了与原语文本对应的另一语言的文本,即译语文本。由于双语文本在词语、句子或段落层级上对齐,词语和结构的跨语言对应数据已可观察。但译文语言难免受到原语文本的影响,显示的并非自然语言使用的原本特征。 (8) 而后者,即可比语料库,由两种不同语言或不同语言变体的文本构成,所含均为原语文本,反映了自然语言使用的模板或真实特征。但是可比语料库中的双语文本间未建立任何连接,无从观察词语对应并确定彼此对象,况且严格意义上的可比语料库至今仍鲜有报道。 (9) 因此,利用平行语料库显示的翻译对等开展对比、研究仍是目前相关领域研究切实可行的出发点,而复现翻译对等(recurrent translation equivalent)体现了翻译社团的双语知识、交际策略和共识,从一个侧面揭示了双语词语的对等关系,因此是最重要的对比依据。 (10) 在对比短语研究中,将搭配序列作为研究单位是必要的策略,搭配序列的异同对比直接指向双语短语单位的对应关系。只有当被比单位的形式、意义和功能特征都相同或相似时,它们才可能具有最大程度上的对等。
基于平行语料库的翻译研究是从平行语料库显示的复现翻译对等出发的,因此接下来将考察它们在双向翻译过程中的互译数据,计算相互对应率,从而评估词语的跨语言对等。结合使用平行语料库和本族语单语语料库,并且通过对比语料库的验证,可以找到翻译对等与典型搭配之间的对应关系。