对外汉语教学的成绩测试
上QQ阅读APP看书,第一时间看更新

第二节
汉语成绩测试的研究现状

进入21世纪后,随着大规模的国际汉语推广工作的开展,汉语教学工作者开始进一步对汉语成绩测试进行专项探索,并注意到成绩测试对教学的反拨效应(backwasheffect)[1]。在这一时期,汉语成绩测试的重要性不仅得到了国内汉语教学界的普遍认同,与此同时,在国外汉语教学界也出现了一些引人注目的测试活动以及关于成绩测试的研究成果。

一、国内的有关研究成果

1.测试的评析标准和题型

2000年,刘珣在《对外汉语教育学引论》一书中专题论述了语言测试。他认为,测试是汉语教学活动的主要环节之一。汉语教师都有可能从事试卷(特别是成绩测试和诊断性测试)的设计和命题工作。有关语言测试的基本理论知识,是每一个语言教师都应该掌握的。作者从测试的作用、测试的种类、测试的评析标准、标准化测试的过程、测试的内容与主要题型等几个方面,对测试作了比较全面的分析和讨论,为我们更好地开展汉语成绩测试提供了重要的启示。

2.有关汉语诊断性测试的研究

2000年,杨翼《从排序看汉语学习者的局部连贯障碍》一文首先尝试用排列句序的诊断性测试作为追寻汉语学习者局部连贯障碍的工具,并尽可能客观地解释了成因,在此基础上提出了汉语教学和测试中的针对性策略。

2001年,杨翼《诊断性测试在对外汉语教学中的应用》一文则系统地总结和讨论了汉语诊断性测试的重要意义、测试类型、测试形式、编制原则和操作环节。作者认为,汉语诊断性测试的结果可以成为我们判断和解释汉语学习者的理解或表达障碍及其成因的重要依据之一。这是对外汉语教学界首次使用和探讨汉语诊断性测试的专题研究,引起了同行的关注。

3.对汉语听力测试的研究

2001年,朱正才、范开泰的《语言听力理解能力的认知结构与测试》用认知心理学理论来解释听力理解的内部机制,提出了一个关于听力理解语言能力的认知结构测试模型。这是对外汉语教学界最早运用认知心理学理论来解释汉语听力理解的内部机制,并建立认知结构测试模型的专题研究成果,丰富了汉语成绩测试的研究方法,开阔了人们的研究视野。

4.对汉语成绩测试的分析

2002年,陈若凡的《谈成绩测试的科学化》提到一种现象:“成绩测试虽然每年都在进行,……但从教学管理的角度来说,尚未组织专门人员对测试进行全面、深入的分析。”该文通过分析听力理解试卷,总结了成绩测试中存在的问题。由此,提出了两个建议:(1)加强命题工作的科学化;(2)建立题库。该文为21世纪面向汉语教学的成绩测试提出了更高的要求和新的研究课题,值得我们深思和进一步努力。

5.对汉语词汇量测试的研究

2002年,钱旭菁《词汇量测试研究初探》一文提出,词汇量测试设计要考虑三个问题,并对确定词的参考标准、选词方法、测试形式提出了建议。该文总结了词汇量测试的作用,提出了词汇量测试的设计方法和原则,为我们开展有关测试提供了新思路。

6.对口语分班测试题型的研究

2003年,李海燕等在《口语分班测试题型研究》一文中,对六种题型(自我介绍、对话、话题表达、看图说话、朗读和听读)进行了调查研究。这一研究结果为我们根据实际需要选择题型提供了有益的启示。

7.对听、说测试之间关系的研究

2006年,任春艳、马新芳《汉语作为第二语言的学习者听说能力关系实证分析》一文对听说能力之间具有高相关,可以用听力水平推测口语水平的认识提出了质疑。这一研究结果提示我们,第二语言的教学和测试要同时注重听、说能力的培养和考查,应根据各自的特点分别设计教学和实施测试。

8.对分班测试的研究

2007年,鉴于对外汉语教学界现行的分班测试多存在费时费力的问题,任春艳在《关于简化分班测试的实验研究》一文中,基于汉语基本句式的习得顺序、限时理论、语言能力测试理论,设计了以句式为内容,以时间为条件的简化试卷,并进行了分班实验,最后对该试卷进行了统计分析。研究发现,简化试卷能够可靠、有效地区分学生的水平,从而实现快速、科学地分班的目的。

同年,辛平在《安置性测试的跟踪研究》一文中,对北京大学汉语教育学院2006年9月换班情况进行了跟踪调查。作者以这次分班测试为例,从分班的结果入手,对安置结果进行了跟踪分析。作者认为,安置性测试中难度系数是关键性指标,难度系数决定鉴别度的大小,应根据学生的水平调整难度。作为表现性评价的作文考试,在对高水平学生的区分上具有不可替代的作用,但对中、低程度的学生,鉴别力相对较弱。在面向多层次的考生群体时,考虑将作文测试作为附加考试,只用来区分高水平考生。该研究从不同的角度探讨了分班测试中的两个重要因素,值得我们深思和开展进一步的研究。

9.建立汉语能力等级共同量表的研究

2007年,方绪军在《CEFR对汉语测试研发的启示》一文中,介绍了《欧洲语言能力等级共同量表》(CEFR)[2]的制定过程及其对语言测试的作用,提出了制定共同的汉语能力等级量表的基本方案。作者认为,不同的测试如果都以语言能力等级共同量表为参考标准,那么测试报告的分数与等级就具有了可比性。语言能力共同量表在不同的测试之间架起了沟通的桥梁,为不同的测试所报告的分数或成绩之间进行比较提供了平台。在实现不同测试之间的可比性方面,CEFR给了我们有益的启示。CEFR适用于欧洲各种语言,各国的考试机构可以参照这一量表制定自己的语言教学大纲,开发各种语言的测试项目。各教学或考试机构还可以根据需要在CEFR的框架中对某个语言能力等级进行再划分,以适应教学和测试的需要。作者提出,制定共同的汉语能力等级量表可以从八个方面着手。

这一研究结果提示我们,建立科学的、获得广泛认同的汉语能力等级量表,对于汉语教学及其成绩测试具有重要意义。因为共同汉语能力等级量表将为各地的不同水平的汉语教学总体设计和阶段性教学提供共同的参照和依据,便于异地不同单位的汉语教学部门在课程设置、教学内容等方面进行交流,也便于异地不同学校的学习者选择合适的汉语课程。该量表又是着眼于用汉语完成交际任务来描述能力的,这样的参照标准势必把教学重点转向培养学生的汉语交际能力;该量表还基于汉语交际需要,对不同等级水平的汉语能力进行了直观的描述,便于用户理解,从而能更有效地发挥测试评价学生的语言交际能力的作用。

10.对任务型语言测试的探讨

2008年,刘壮等在《对任务式语言测试的探索》一文中探讨了任务式语言测试中的测试模型、任务与项目、语言知识、任务与语言能力等问题。作者还提出,经过需求分析才可使测试任务具有代表性,遵循一致性原则才可实现任务式语言测试。这是汉语教学界最早对汉语任务型语言测试进行探讨的专题文章,为我们开拓了一个新的研究领域。

二、国外的有关研究成果

进入21世纪后,随着中国经济的高速发展,国外学习汉语的人数不断增多,对汉语人才的需求越来越大。在国内汉语教学工作者进一步研究汉语成绩测试的同时,国外的汉语教学工作者[3]也加深了对汉语成绩测试重要性的认识,并针对非目的语环境下的汉语教学特点,开展了各种研究活动。因此,国外汉语教学界也出现了一些引人注目的关于汉语成绩测试的专题研究成果。

1.口语能力测试与汉语学习成绩

2003年,柯传仁、沈禾玲《回顾与展望:美国汉语教学理论研究述评》一文对近二十年来美国中文教学的研究从八个方面进行了介绍和评价。其中对汉语测试研究的介绍,是我们所能看到的本世纪最早介绍美国汉语教学界测试与评估最新发展状况的文献资料,尤其值得关注。柯文主要介绍了两项研究(Ke,1993;Ke &Read,1995)成果,一项是关于口语能力测试的,另一项是对学生汉语学习成绩的全面评价。因为这两项研究均与美国外语教学学会(ACT2FL)制定的“口语能力测试(OPI)”有联系,因此,他同时也介绍了一下OPI。这是作者首次对美国暑期汉语强化学习阶段的学生的学习进展情况进行的全面评估,所获得的资料为今后进一步研究美国暑期强化教学的各个方面提供了重要信息。

2.关于汉语成绩测试的探讨

2006年,崔颂人《略谈对外汉语成绩考试的改进》一文分析了中美两国二十余所大学及几个暑期短训班的考试成绩情况,从测试效度、信度、考试频率、成绩测试与教学目标、试题内容抽样、题型选择以及反拨效应等方面,对汉语成绩测试进行了一次初步探讨。

这项研究提示我们,要使汉语在全世界成为真正的强势语言,不但要提高汉语教学水平,同时也要提高测试水平。由于成绩测试特有的强制性、经常性和经济性,它可以直接、多次地影响到所有学习汉语的学生。因此,搞好成绩测试,具有很大的现实意义。

3.按需求建立多样化的考试

2006年,贾笑寒在《日本国内的汉语能力考试及其借鉴意义》一文中指出,从世界范围来看,日本的汉语考试制度相对发达并较为完善。这对完善我们国内的汉语能力考试有一定的借鉴意义。日本社会对汉语人才的需求不断扩大,汉语教学也迅速发展。有正规的学校教育,有面向社会各层次的汉语学习班,还有通过广播、电视自学汉语的学习者。学习者的多样化使充实和完善多样化的汉语考试成了一个迫切而重要的问题。日本目前主要有3种汉语考试:中国语检定、商贸中国语检定、中国语交际能力测试(TECC)。导游资格考试等职业资格考试中也含汉语考试。这三种考试都是顺应时代需要而产生的,它们不仅完善了日本国内汉语考试制度,而且也基本满足了日本社会对汉语能力考试的市场需要。

这种根据学习者的多元化,发展多样化的汉语教学,并随之匹配和完善多种汉语考试的市场运作机制,值得国内同行借鉴。

4.测试如何全面考察综合能力

2006年,雷莉在《韩国三星集团的汉语教学》一文中介绍了韩国三星人力开发院汉语教学的学生测试系统。它包括语言测试、学能、学习态度、演讲与发表、写作能力等几个方面。他们的语言测试有每日测试、单元考试、期中考试、期末考试、HSK考试、SST考试[4]等。SST等级的提高不仅是词汇量的增加和语法能力的提高,而是全面的、综合的能力提高,包括话题范围增加,话语内容更丰富、深入,语言形式准确、灵活,表达自然、得体。这种全面考察综合能力的测试方式值得国内同行注意。

总的来看,进入21世纪以后,国内外的汉语教学工作者对汉语成绩测试的研究更加多样、全面、具体。

[1] 反拨效应指的是成绩测试对教学和学习的影响。反拨效应有两种英语表述:backwash effect或washback effect,它们的内涵相同。

[2] “欧洲语言能力等级共同量表”(the Common European Framework of Reference),简称CEFR。

[3] 指在国外开展汉语教学的工作者,这里不考虑其国籍的真正归属。

[4] SST(Samsung Speaking Testing)测试是效仿美国的OPI(Oral Proficiency Interview) 测试而产生的。它根据所表达的话题范围、深度以及遣词造句能力和交际的正确程度,将汉语口语能力分为初级、中级、高级、超高级四级。它主要从四个方面来评价受试者的语言能力。