前言
到目前为止,任何想为新SAT[1]考试编写词汇书的人都不得不面临这样一个问题:如何在真题数量有限的情况下编写词汇书?怎样编写一本经得起考验的词汇书?我们可从下面两个方面来看。
1.词汇的选择
目前市面上绝大多数SAT词汇书中的词汇都是来自真题。这种做法的原因有两个:首先,词汇书应该只收录会在考试中考査的词汇,而不应该收录词典上的所有词汇,否则就失去了编写词汇书的意义。其次,像SAT这样的国外标准化考试虽然没有词汇大纲,但它们在考试难度上有明确的一致性的要求;为了保证考试的公平性和不同日期的考试在成绩上的可比性,试题难度总体上应保持不变。而这一要求在词汇方面导致的结果是:第一,每场考试考查的词汇总量基本一致;第二,每一场考试所考查的词汇在内容上高度重复。也就是说,任何一场考试所考查的单词大多数都已在以往的考试中出现过。于是在收录词汇时一个方便且合理的做法便是只收录在以往考试中出现过的词汇。
从实际情况上来看,SAT考试在词汇方面确实很好地达到了前后难度一致的要求。例如,通过统计2006—2013年考题的阅读部分[2],可以发现其所考査的词汇总量普遍在1400左右[3](图1)。此外,如果将2006—2011年的SAT真题作为语料库,用2012—2013年的题目用来测试的话,会发现语料库中的词汇对于2012—2013年题目所考査词汇的覆盖率均在85%-90%(图2)。
此外,很多时候词汇书编者们在统计词汇时会尽量多统计一些考题。这是因为在实际考试题目中,虽然大多数单词都在以往考试出现过,但很难出现所有的词汇都可以被以往考试覆盖的情况,也就是说每次考试都会考查一定数量的“生词”。于是,统计的考题越多,则得到的词汇就会越多,对未来考试中词汇的覆盖率也会越高。
想要验证上述说法的话,可以研究一下所统计的题目套数与最终统计出的词汇总量间的关系。因为如果统计出的词汇对考题词汇的覆盖会随统计题目套数增加而增加的话,考题中的“生词”就会相应减少,于是统计时每多统计一套题目,所得出的新词就应该越少,也就是说多统计出的词汇量与统计的题目套数间存在边际递减的关系。
图1 阅读题目考查词汇总量
图2 2006--2011年词汇对后续考题词汇覆盖率
实际的研究结果基本与上述理论相符。如果将2006—2013年的题目作为语料库进行统计,会发现统计出的词汇量会随着语料库规模的增大而增长,且增长率大致上逐渐降低(图3)。
下面回到开篇提出的问题,即如何在没有真题的情况下为新SAT考试编写词汇书。从上面的讨论中可以发现,真题对于词汇书的编写有着极其重要的作用;在没有真题的情况下为考试编写一本在选词上科学合理的词汇书是非常困难的。实际上我们一开始也并没有为新SAT考试编写词汇书的打算,直到我们后来看到了College Board发布的新SAT考试介绍(TestSpecificationsfortheRedesignedSAT)。
图3 收录题目套数与所统计出的词汇量
该文档详细介绍了新SAT阅读部分的情况并附上了样题。从中我们得到了这样的印象:虽然新SAT考试阅读部分在文章题材和题目设计上与旧SAT略有区别,但在文章的词汇难度上两者是基本一致的。也就是说,旧SAT阅读文章中的词汇有可能很好地覆盖新SAT阅读文章中的词汇。
实际的测试显示上述猜想是成立的。通过对比2006—2013年题目中词汇对于2014年题目和新SAT样题文章的覆盖情况可以发现,覆盖率是基本一致的(图4)。
图4 2006--2013年题目中词汇对后续题目的覆盖率
于是,通过继续使用旧SAT阅读题目作为统计词汇的素材,便可以很好地解决目前新SAT缺少真题的问题。
在词汇选择上,另外一个需要注意的问题是,高覆盖率不应该是词汇书的唯一要求,否则备考时完全可以用词典来代替词汇书。好的词汇书应该在保证足够高的覆盖率的前提下收录的词汇尽量少,从而尽可能减少读者的学习负担。
具体到SAT阅读词汇上,如果统计《官方指南》以及目前所有考过的真题,可以得到超过11000个词,而即使去掉其中的中学基础词汇,将其全部收录到一本词汇书里也明显不合适,因此有必要对这部分词汇进行筛选以减少收录词汇的数量。
一种传统的筛选方式为删除其中的“专业词汇”。这一做法虽然在词汇书中非常常见,但其有着显而易见的缺点,即筛选过程中存在严重的主观性。虽然阅读题目中很大一部分单词都可以明确判断其究竟“专业”还是“非专业”,但同时也有很多单词难以进行这样的判断。例如,将abandon列为非专业词汇予以收录,而将sauropod(一种恐龙)列为专业词汇而不予收录,相信大多数人都不会有异议。但是对于oak(橡树)或者Antarctica(南极洲)这样的词究竟应该算专业还是非专业,估计人们想达成一致就不那么容易了。而这些难以判断的词最终往往只能按照作者的主观标准来进行分类,于是最终的筛选结果难免时不时无法准确反映实际考试的词汇。
另一种常见的筛选方式在最近几年开始流行,即根据词频进行筛选。具体做法为统计每个词条在实际考试中被考査的频率,只在词汇书中收录其中频率较高的,比如只收录考过至少两次的。这一做法虽然可以有效地消除词汇书编者在选词上的主观性,但有些时候也会收录一些对于考试几乎没有实质性帮助的词汇。这是因为考试中有某些阅读文章会反复提到一些极其生僻的词汇,这些词汇对于文章的理解影响很小,而且在其他的文章中也没有出现过,也就是说一般的考生并不需要掌握。但由于这些词汇在一篇文章里的出现频率非常高,所以仍然会在筛选时保留。
为了应对上述问题,我们在对考题中词汇进行筛选时采用了改良的词频法:只有至少在两篇文章中出现过的词汇才会被收录[4]。这样可以很大程度上避免收录帮助不大的词汇,同时又不必引入编者的主观性。
在实际效果上,经过筛选后的词汇书在实用性上得到了很大的提高:从《官方指南》和2006—2014年真题中统计出的词汇在不加处理的情况下对新SAT样题文章词汇覆盖率为89.89%,筛选后覆盖率仅下降到了85.37%,但词汇规模却从11000减少到了6300,几乎减少了一半。由于在真实的阅读文章里基础词汇会反复多次出现,覆盖了一篇文章中绝大部分词数,所以这6000多个词汇可以覆盖实际阅读文章中超过98%的词数。也就是说如果能完全掌握本书中的内容,阅读时每读100个单词可以认识其中至少98个,这时词汇就基本不会构成理解的障碍。
2.释义的编写
科学合理的选词只是编写词汇书的第一步;在此基础上,释义的质量也同样重要。可能有人会觉得为词条编写释义不过就是把英语定义准确地翻译成汉语而已,但实际上,准确地表达出词汇的意思只是词典需要满足的最基本的要求;真正的词典编译过程有非常多的问题需要考虑。比如应特别注意的是,在编写时,释义应尽量避免歧义。因为在真正的学习过程中,学习者因词典和词汇书上释义存在歧义导致对词汇理解偏差的例子非常常见。比如catalogue—词常常被直接译为“目录”,于是几乎所有的学习者都会误以为其表示书前面的目录,但其实这个词指的是物品或商品的目录。这就是典型的辞书编者在编写释义时对有可能导致的歧义考虑不够的例子。而像《朗文当代英语词典(第4版)》中的释义“商品目录,购物指南”则考虑周到得多,大大减少了歧义;类似的,《牛津高阶英汉双解词典(第7版)》中的释义“目录;目录簿”也比单纯一个“目录”要好。
对于词汇书作者而言,编写释义时一个相对取巧的做法是直接照抄英汉词典上的释义。但问题在于,并不是所有的英汉词典在释义编写上都采用了很高的标准(各种常见的网络词典一般都是极低标准的典型代表),所以具体选择参考哪一本或者哪几本词典也是需要仔细考虑的。此外,由于英汉词典在规模上往往极为庞大,编者很难做到面面俱到,所以即使是质量公认极高的英汉词典,也难免会有个别释义仍然有提高的余地。而词汇书由于收录的词汇和义项均远远少于一般的英汉词典,因此其在每个释义上都追求精益求精不仅是可行的,同时更是理所应当的。所以本书在释义编写上采用了参考英汉词典并加以适当修改的策略;对于容易导致歧义的释义,本书中采取替换为意思更为明确的解释,而对于我们能发现的在英汉词典和其他词汇书上经常存在的一些误译或不理想的翻译,在本书中也得到了修改。
比如,arbitrary(based on random choice or personal whim,rather than any reason or system[5])一词在本书中被解释为“随意的,主观的,非理性的”,而非英汉词典中普遍采用的“武断的”。这样可以避免由于后者本身的歧义性导致读者将其错误理解为“盲目自信的”,进而对诸如“an arbitrarystandard”这样的用法感到困惑。再比如,nevertheless通常被译为“然而”;这样译虽然在意思上没有问题,但“然而”在汉语里的句法和“nevertheless”在英语里的句法是有很大区别的,因此我们将其译为“仍然,还是;尽管如此”,从而使读者对于“statements which,although literally true,are nevertheless misleading”这样的用法更不容易产生误解。
而一些英汉词典中长期存在的误译和词不达意的释义在本书中也都被删除。如impressive经常被译为“给人印象深刻的”。这一译法不仅从中文文法的角度上让人感到别扭,而且也譯艮难说体现出了impressive的实际意思、(evoking admiration through size,quality,or skill:grand,imposing,or awesome)。因此本书中将其译为“极好的”。
此外,由于词汇书毕竟是为备考编写的,所以个别情况下我们也会对词典定义进行适当的修改,以使其更适合题目实际的考法。如indebted虽然词典定义为“owing gratitudefora service or favor”,但由于实际考试中该词常用于比喻义,如“American diplomacywas indebted to its historical precursors.“(2013年1月SAT),因此编写释义时我们在“蒙恩的”基础之上还额外加入了“受益于……的,受……影响的”。再比如,由于在SAT阅读考试中能否准确把握词汇的感情色彩常常会对解题有极大影响,因此编写释义时对词典定义中体现得不明显的感情色彩我们会加以适度强调,例如:wry(using or expressing dry,esp.mocking,humor)在本书中被译为“嘲讽的,挖苦的,冷嘲热讽的”。而在此基础上,根据College Board的新SAT考试说明,未来的SAT考试在Writing and Language Test部分对于考生对单词用法的掌握提出了较高的要求,所以我们在编写释义时也尽量要求能体现出单词的实际用法,如coin,我们参考词典定义“invent or devise(a new word or phrase)”将其解释为“发明(词语或说法等)”而非简单的“发明”。
再者,考虑到本书的使用者主要是高中生,因此在释义的编写过程中我们也专门为此增加了一些额外的调整。比如,在不影响释义准确性的前提下,我们会优先使用相对常见的汉语词而非生僻词进行编写;当使用相对生僻的汉语词进行解释确实会更准确时,我们也会加人一些附加的解释来帮助读者理解。因此像editorial一词在本书中并没有被筒单地解释为“社论”,而是“社论,报刊和杂志上由编辑撰写的评论性文章”。
以上是我们在编写本书时背后所遵照的一些原则。我们希望通过高标准的编写工作可以为学习者带来一本真正经得起考验的词汇书。
关于本书对于ACT备考的适用性
作为SAT的同类考试,ACT考试在词汇难度上与SAT非常接近。因此我们也针对ACT阅读部分的词汇进行了分析,以研究本书内容对于ACT考试的适用性。我们随机选择了五套ACT考试的题目,发现其阅读部分平均词汇量在1400词左右,并且本书内容加上初中基础词汇一般可以覆盖到其中80%以上(见下表)。
而如同前面关于SAT考试的内容所述,由于在真实的阅读文章里基础词汇会反复多次出现,覆盖了一篇文章中的绝大部分词数,所以一篇ACT阅读文章中约95%的词汇都可以被本书或初中词汇所覆盖。也就是说本书是完全可以用于ACT备考的。
冷楠
2015年12月