第一部分
秋
第1章
寻找最好教育的旅程
藏宝图制作人:安德烈亚斯·施莱歇尔,在巴黎。
安德烈亚斯·施莱歇尔在教室后面安静地坐下,尽量不引起其他人的注意。他时不时就会这样,漫无目的地走进某个他无意选修的课堂。这发生在20世纪80年代中期,准确地说,他当时在汉堡大学(德国一所顶尖大学)学习物理。然而在课余时间里,施莱歇尔却像浏览电视频道一样,随意走到其他课堂旁听。
他现在旁听的这门课是由自称“教育科学家”的托马斯·内维尔·波斯尔思韦特所讲授的,施莱歇尔对这个头衔非常好奇。施莱歇尔的父亲是汉堡大学的教育学教授,并一直将教育当作一门神秘的艺术(比如瑜伽)谈论。他父亲总喜欢说“人们永远无法衡量教育中很重要的那个部分——人的品质”。而在施莱歇尔看来,教育是毫无科学性可言的,这也是他偏爱物理的原因。
但这个英国“教育科学家”似乎与施莱歇尔的父亲对教育的看法大相径庭。波斯尔思韦特是“新式朦胧派”研究者中的一员,这一学派就像物理学家研究教育课题那样(如果可能的话),总是试图以定量的方式来分析无形的主题。
施莱歇尔仔细地听着关于数据和取样的讨论,他淡蓝色的眼睛里流露出专注而殷切的神色。虽然他知道父亲不会赞同这位老师的观点,但心中却开始想象,如果有人真的可以比较世界各地的孩子所掌握的知识量,并通过调控种族、经济状况等影响因素来进行比照分析,那会出现什么样的结果呢?他发现自己不知不觉地举起了手,加入到讨论中来。
在他看来,德国学校并不像德国的教育工作者所认为的那样出色。上小学时,他有很多时候都感觉上课很无聊,而且考试成绩平平。但是到了十几岁以后,在几位老师的鼓励下,他对科学和数据产生了兴趣,他的成绩也在那时得到了提高。到了高中,他已经获得了国家科学奖,这意味着他大学毕业后至少能在企业找一份高薪的工作。在走进波斯尔思韦特的课堂之前,他也正是这么计划的。
下课后,教授让施莱歇尔留了下来。他看出了这个说话声音微弱、面容清瘦的年轻人有些与众不同。
“你愿意协助我做这项研究吗?”
施莱歇尔惊讶地望着他:“可我不懂教育。”
波斯尔思韦特微笑着说:“没关系,这不重要。”
从那以后,两人开始了合作,并最终创立了世界上最早的国际阅读测试系统。这个测试系统很简单,所以并没有被教育从业者放在眼里,包括施莱歇尔的父亲。但是这位年轻的物理学家对数据深信不疑,无论结果如何,他都会继续研究下去。
聪明的孩子并不会永远那么聪明
2000年春,来自43个国家的30多万名中小学生用两小时完成了一个他们前所未见的测试。这个陌生的新测试被称为PISA,与其他的测试不同,这个测试可能会问购买某种商品需要使用什么样的硬币组合,也可能要求你在试卷上设计自己的硬币。
PISA是由经合组织研发的,研发该测试的核心科学家正是安德烈亚斯·施莱歇尔。这时,距离施莱歇尔到波斯尔思韦特的课堂旁听已经过去了十几年。那堂课以后,他开发和设计过许多测试,不过一直名不见经传。根据多年来积累的经验,他认为,想要在现代社会中脱颖而出,人们需要具备良好的思维能力和沟通能力,因此,这个世界需要一种可以衡量思维和沟通能力的更智能的测试。
在PISA之前,也出现过一些总让人记不住名字的国际测试,但这些测试倾向于评估孩子们记住了什么,或老师在课堂上给他们灌输了什么内容。也就是说,这些测试通常都是为了测量学生的升学能力,而非生存能力。当时,还没有一种测试是专门测评青少年在数学、阅读和科学方面的逻辑思维和解决问题能力的。PISA希望能够发现哪些国家是在培养孩子们的独立思考能力。
2001年12月4日,测试的结果全部整理完毕。经合组织在法国米埃特酒庄举行了一场新闻发布会。面对众多记者,施莱歇尔及其团队指出了PISA的独到之处。
“我们不是在寻找方程式或选择题的答案,”他说,“而是在评价考生的创造性思维能力。”
记者们群情踊跃,迫不及待地想知道测试结果排名。最终,施莱歇尔向大家宣告:“排名第一的国家是芬兰。”现场一片沉默,时间仿佛暂停在那一刻,就连他自己也对这一结果感到惊讶和困惑,只是没有表现出来。停顿了一会儿,他接着说:“在芬兰,每位测试者的表现都很好,而且与学生个人的社会背景没有太大关系。”
芬兰?是不是搞错了?教育专家们窃窃私语,就连芬兰的教育专家也不敢相信这一结果。
测试参与国都举行了自己的新闻发布会,宣布测试结果的详细情况。芬兰也在2000千米外的首都赫尔辛基发布了公告。芬兰教育部长大步走进发布会现场,准备像往常一样对一群芬兰记者发表一份通告声明,可她却惊讶地发现,发布会现场挤满了来自世界各地的摄影师和记者。她结结巴巴地发布完声明就撤回了办公室。
随后,来自外国电视媒体的工作人员在芬兰教育部大楼外采访了芬兰教育部官员。在12月凛冽的寒风中,他们的外套都随着从芬兰湾吹来的海风飘动。其实芬兰的教育部官员们对此也很困惑。一直以来他们都在向其他国家,尤其是美国或德国的教育从业者寻求教育系统上的建议,无人关心芬兰本国的教育到底发展到了什么地步。
在芬兰人感到困惑的同时,德国人则表示极为震惊。德国教育委员会主席在联邦议院称该结果是“德国教育的悲剧”。德国人向来认为他们的教育体系是世界上最优秀的,但德国孩子在阅读、数学和科学方面的表现却低于发达国家的平均水平,甚至比美国人更差。
德国《明镜周刊》在其封面上发出感叹:“德国学生很笨吗?”
《经济学人》的封面上公然写着:“愚钝!”
每个国家(包括德国)的教育专家都曾经帮助施莱歇尔和他的同事草拟过测试题,因此,他们对这一结果无可辩驳。于是,有些评论家将这种结果归咎于教师的失职,而另一些则认为电子游戏是孩子们成绩不佳的罪魁祸首。PISA逐渐被德国本土人民所熟知,甚至催生了一档在黄金时段开播的名为“PISA Show”的电视智力竞赛节目。教育专家们定期朝圣般的来到芬兰,希望能探寻到弥补本国孩子成绩不佳的办法。甚至连施莱歇尔的父亲都加入进来,在测试结果宣告之后与儿子展开了论战。
处在大西洋彼岸的美国,PISA成绩排名介于加拿大与希腊之间,之后几轮测试也预计都会处在这样的中间位置。美国青少年在阅读项目上的表现比较好,给我们带来稍许安慰。不过,数学技能往往能更好地预测测试者未来的收入状况。
即使是在阅读方面,美国同龄孩子的最高分和最低分之间90多分的差距也堪称天壤之别。相比之下,韩国孩子的这项差距只有33分,并且几乎所有人的得分都高于美国同龄孩子的得分。
时任美国教育部长的罗德·佩奇(Rod Paige)对这一结果感到很痛心。他说:“美国孩子的平均水平远未达到理想状态。”他还郑重表示,要提高美国的排名,“不让一个孩子掉队”。最终“不让一个孩子掉队”(No Child Left Behind)成为一部新的教育问责制改革法案,并由当时的总统小布什签署发布。
还有一些美国人为本国的教育体制辩护,并将这种不甚理想的结果归咎于学生的种族或民族多样性。本着严谨而审慎的原则,施莱歇尔用数据回应说:美国孩子的糟糕表现不能归咎于移民。即便将本次测试结果中移民学生的分数忽略不计,美国孩子的排名也没有多大变化。其实在世界范围内,移民导致的各国之间的成绩差异只有3%的浮动。
虽然学生的学习能力与其种族和家庭收入相关,但在不同国家,这种相关性也存在很大差异。父母富有并不意味着孩子能考高分;同样,父母贫困也并不意味着孩子学习成绩差。美国私立学校的孩子往往表现得更出色,但他们并不比公立学校里家庭条件同等优越的孩子更好。从统计学角度来说,“就读于私立学校”并没有为这一结果增加多少分值。
实际上,PISA的测试结果揭示了显而易见却被视而不见的东西,那就是教育经费的大量投入并不会使孩子变得更聪明。其实,这一切都取决于老师、家长和学生如何利用这些经费。如同其他很多大型组织——从通用电气公司到海军陆战队——最后的成功取决于执行力,这也是最难做好的部分。
在2003年、2006年、2009年和2012年,世界各地的青少年都进行过PISA测试。随着加入的国家增多,到2012年,PISA试卷的语言已经增加到了40多种。每一次测试的结果都打破了我们的思维定式:一方面,并不是所有表现好的孩子都生活在亚洲;另一方面,不是只有美国孩子在创造力方面表现突出。创造力测试是PISA的一个重要组成部分,美国之外的其他许多国家的孩子在这方面都表现不俗。
另外,测试结果还说明了在教育上的财力投入和孩子能学到的知识并不成正比。世界上培养出最聪明孩子的国家,其纳税人为每个学生在教育上的花费比美国人少得多。还有,家长的参与也是一个复杂的因素。教育强国中的父母,并不一定比其他国家的父母在孩子的教育上花了更多精力,只是参与形式不同罢了。而且,最令人欣慰的是,聪明的孩子并不会永远那么聪明。
过去的测试结果显示,芬兰孩子并非天生聪明,只是在最近的测试中开始有了良好表现。这说明,改变是可以在某一代人身上实现的。
随着经合组织最新数据的公布,施莱歇尔成了知名教育专家,他到国会证实了测试结果并给各国的教育部长出谋划策。现任美国教育部长阿恩·邓肯(Arne Duncan)说:“没有人比他更了解这一全球性问题。尽管忠言逆耳,但他确实揭示了真相。”英国教育大臣迈克尔·戈夫(Michael Gove)抛开了施莱歇尔是个生活在法国的德国人的事实,称其为“英国教育界最重要的人物”。
然而在各大洲,PISA也招来了不少批评。有些人说,这种测试带有文化偏见,或者说在试题翻译时产生了很多偏差。还有人质疑从美国165所学校中抽取的5233名学生的样本太小或存在这样那样样本选取上的瑕疵。许多人认为,施莱歇尔和他的团队应该只负责整理统计考试分数,而不必推敲导致高分或低分的原因。
多数情况下,施莱歇尔会对这些批评不屑一顾。他承认PISA并不完美,但目前没有比PISA更好的测试办法了,更何况他们每年都在对PISA进行改进。他带着PPT从一个国家飞到另一个国家,像《圣经》推销员那样,每到一处都吸引着众多信徒。这些信徒带着PISA分数散点图,如痴如醉地听着他的讲座。当讲到最后一张PPT时,上面永远显示着“如果没有数据,你可能只是持……观点的人。如果没有数据,你可能只是持……观点的人”。
并不是所有能力都可以用考试来衡量
2010年4月,我在华盛顿特区与施莱歇尔进行了初次会面,当时正值国家广场的樱花盛开。他在美国国会大厦旁边的办公楼里开会,利用两场会议的空隙时间,我们交谈了几分钟。那时候,施莱歇尔已经头发花白,留着棕色的小胡子,看起来仍十分精神,我们开门见山地直奔正题。
我告诉他PISA给我留下了深刻印象,但我也有一些怀疑。据我了解,美国比其他任何国家在考试上所投入的时间和金钱都多,过去积累下来的海量数据可以证明这一点。孩子们年年为各种考试几近麻木地奔忙着,PISA真的与这些泡沫般的考试不同吗?
他轻轻地坐下来,像带有轻微德国口音的机器人似的平静说出一连串统计数据和相关说明,依次对我的问题进行解答。
“PISA不是传统的学校测试。”他说,“不过这个考试非常具有挑战性,因为考生在考试过程中必须开动脑筋认真思考。”
我反驳说:“并不是所有能力都可以用考试来衡量。”
施莱歇尔点点头表示认同,同时说道:“PISA确实无法衡量考生全部的个人能力,在这一点上,我同意你的观点。”
一种满足感油然而生。即便是施莱歇尔自己,也承认数据有其自身的局限性。但当他继续往下说的时候,我才意识到我没领会他的意思。
“我认为PISA需要不断改进,扩大可测试的范围,例如评估协作解决问题的能力等,我们正在朝着这个方向努力。”
我感到在他的心中,PISA几乎是万能的。即使现在不是,但总有一天会是。他坚持认为PISA与我参加过的其他任何考试都完全不同。
我们握了握手,他便回头赶往下一场会议。离开时,我认真思考了他说过的话。要想知道PISA是否真的如他所说——与我曾经参加过的任何考试都不同,那就只剩下一种办法了。
我的PISA得分
我早早地来到了考场所在地,也许我是第一个怀着如此兴奋的心情参加标准化考试的考生。执行PISA测试的研究人员在华盛顿市中心K街靠近白宫的地方设了一个办事处,夹在一堆律师事务所和访客接待区之间。
在电梯里,我突然想到自己已经有15年没有参加过任何考试了。时隔15年再来参加这样一次测试,恐怕会发生一些令人尴尬的事情。于是我在心里默默地对自己进行了一次快速突击测验,比如什么是二次方程式,圆周率是多少,可是却怎么也答不上来。就在我苦思冥想的时候,电梯门开了。
一位年轻和善的女士将我领进一间办公室。她把测试用的铅笔、计算器和试卷仔细地摆好,并大声朗读了测试的官方说明,解释说PISA测试的目的是了解“你学到了什么,以及学校对你来说意味着什么”。
在接下来的两小时里,61道数学、阅读和科学方面的试题轮番考验着我久未经考场的大脑。某些试题可能还会在以后的试卷中出现,因此PISA的工作人员要求我承诺不将具体试题公之于众。但是我可以将出过且不再收录的试题,以及其他经PISA同意可以公开的样题与大家分享。例如下面这道数学题:
一个电视台记者展示这张图并说道:“该图显示,从1998年至1999年,抢劫案件的数量大大增加。”
你认为这位记者是否合理地解读了该图所要表达的意思?请给出支持你答案的理由。
类似的问题很多,都是要求考生写出自己的观点,下面留有一块空白作为答题区。这让我感到有些费解。从什么时候开始,标准化测试竟也开始关注答题人的主观想法了?
而其他的试题,让我想起自己在成年之后曾面对的难题——必须理解医疗政策的各种细则,或者比较相互竞争的银行所提供的同类服务在费用上的优劣。与学校的考试相比,PISA似乎更像是生活技能测试。
试卷中已经给出了可能用到的所有数学公式,包括圆周率的值,谢天谢地!但我发现,我需要经过深思熟虑,才能给出绝大多数题目的答案。当我打算在数学部分加快速度时,却发现必须不断地杀回马枪去修改前面试题的答案。
某个阅读样题中给出了某家公司贴出的流感疫苗注射通知,这类通知在人们的办公室公告牌上随处可见。通知单是由一个名叫菲奥娜的员工设计的,就像货真价实的由人力资源部门发出的通知单一样!试题要求对菲奥娜的设计进行分析:
菲奥娜希望这个通知单的风格平易近人且带有鼓励性,你觉得她做到了吗?请根据其作品的布局、文案风格、图片或其他图案的具体细节,对你的答案做出具体说明。
对我来说,科学部分是最棘手的。在答题过程中,我不止一次地靠猜测来答题,大部分题目关注的是日常生活中可能会用到的科学,比如运动时人的肌肉会发生什么变化、哪些食物富含维生素C。
距规定的测试结束时间还有20多分钟的时候,我完成了试卷。与真正的学生测试不同的是,我可以给自己打分。根据答案与给出的众多参考答案的贴近程度,可以给零分、满分或部分得分。这大约花了我一小时,“聪明”的考试必须人工打分(至少部分如此),这使得这些考试大大增加了成本,从而变得昂贵且少见。
关于抢劫的试题,官方给出了10个不同版本的满分答案,只要答案表达的是否定的意思且指出这份绘制得不准确的图表中存在的问题,即回答出“柱状图没有从0开始”这一要点或指出“抢劫案件的增长率其实相当低”,就可以给满分(在芬兰、韩国和美国的考生中,只有三分之一的人正确回答了这个问题)。
关于流感疫苗注射通知单的试题,并没有正确答案。无论回答是或否,至少都要援引通知单中的某一个具体特征并对其做出详细评价,才能得到满分。仅仅摘录题目中已经包含的“友好”和“鼓舞人心”等词语是不够的,而诸如“有趣”、“易于阅读”和“清晰”等描述都被认为太过含糊。考生的评价必须是原创的,并且官方对评价的要求相当高。纵观世界范围内的考生,只有40%的人能把这一问题回答得尽如人意。
不同国家的试题略有不同。比如这项测试不会要求墨西哥的学生回答如何测量伊利湖(美国五大湖之一)的直径。但类似的细节变化对考试结果的影响微乎其微,原因在于PISA并不仅仅是针对客观事实的测试,它还考查考生是否能够根据既定事实来分析解决问题。
最后,因为没有其他人在场,我只能向我的监考老师宣布了自己的得分。我只做错了一道题(科学题)。她毫不吝惜地夸赞道:“非常好!”但是我们都心知肚明,作为一个比普通的PISA考生多了22年生活经历——其中包括4年大学生活经历的考生,这个成绩在预料之中。
离开大楼之后,我的轻松感逐渐褪去。我意识到,我取得的分数并不代表我所在国家的中学生的分数。这个测试不太容易,但也没有那么难。其中有一道试题,美国15岁的年轻人里,只有18% 的考生和我一样做出了正确回答。还有许多类似的情况,大部分或绝大部分芬兰学生和韩国学生都能像我一样回答正确,可大多数美国学生却毫无头绪。
PISA所考察的是顺利解决问题和自如沟通的能力,换句话说,在这个充斥着海量信息和受制于迅速变化的经济形势的世界中,每个人都要有做好自己本职工作和照顾好自己家庭的基本技能。如果大多数青少年在这次测试中都表现不佳,那么对于一个国家来说意味着什么呢?并不是所有孩子都必须成为工程师或律师,但是他们都需要学会如何思考,不是吗?
我仍然不认为PISA可以衡量一切,但我现在对它能够衡量逻辑思维能力这一点深信不疑。美国大学教授协会(American Association of University Professors)曾经宣称批判性思维是“美国教育的特点——为自由社会培养有独立思考能力的公民”。如果批判性思维能力是美国教育的显著特征,那为什么15岁的美国孩子仍未显示出这种能力呢?
美国的纳税人在教育上投入了大量时间和金钱,这是不可回避的事实。在2009年的PISA测试中,美国学生的数学成绩排名第26位,科学排名第17位,阅读排名第12位。我们只有一项排名高居第2位,那就是学生的人均花费(只有一个国家的学生人均花费高于美国,那就是卢森堡。而卢森堡的人口比美国田纳西州首府纳什维尔市的人口都少)。
这样的浪费发人深省。有经济学家发现,PISA得分与国家的长期经济增长几乎成正比。当然,经济增长的影响因素有很多,但是劳动人口的学习能力、思考能力和适应能力才是经济发展最根本的激励因素。如果美国学生的PISA成绩能和芬兰比肩,那么美国的GDP将以每年一万亿到两万亿美元的速度增长。
对于学生来说,通过PISA得分来预测谁能考上大学,往往比学校成绩单的预测效果更好。那些在PISA阅读测试中成绩不佳的学生,有很大可能会在高中辍学。可以说,PISA衡量的不是考生的识记能力,而是志向和抱负。
怀着一种不安的心情,我暂且将测试放在了一边。PISA与上千页的测试结果分析报告勾勒出了一张教育地图。这张地图能帮助人们认清世界上哪些国家正在教育他们的孩子学会独立思考,哪些还没有这样做。
最成功或排名提升最快的国家基本可以分为三种类型:(1)像芬兰这样的乌托邦型——教育机制完全建立在相信孩子在没有过度竞争或没有父母过多干预的情况下,也能获得较高层次的逻辑思维能力的基础上;(2)像韩国这样的高压型——在韩国,因为孩子们面临的学习压力过大,在学习上用力过猛,政府甚至下达了学习宵禁令,试图缓解这一紧张局面;(3)像波兰这样的破茧成蝶型——波兰是处于上升期的国家,贫困孩子的比例与美国不相上下,但孩子们掌握的知识和技能在最近一段时间内有显著增长。
然而,PISA仍旧无法向我们解释,为何上述那些国家的孩子如此聪明,也无法向我们揭示,与美国孩子相比,那些国家的孩子每天的生活是如何度过的。孩子们的人生机遇与任何考试都衡量不了的某些因素息息相关。韩国孩子是被动去学还是顺其自然地取得了成功呢?这两者有很大不同。芬兰学生的个性、品质和他们在数学测试上的表现一样杰出吗?现在我们有了数据,可我们还需要深入了解这些孩子的生活是什么样子的。
因此我准备到芬兰、韩国和波兰去实地考察,看看我们能从这些国家的孩子身上学到什么。这种神奇的事情只有亲眼看见才能相信。