第四节 从众的神经机制研究
从众研究自20世纪50年代开始兴起,尽管有大量与之相关的文献,但我们对于从众的内在机制所知甚少。近年来,随着神经生理技术的发展,其在从众研究中的应用可以为我们打开从众行为背后的“暗箱”。众多研究者们采用功能性磁共振技术与事件相关电位技术,对于人类从众行为背后的大脑神经活动情况进行研究。以下,我们综合所有相关的研究,对从众行为的神经机制进行梳理与总结。
Bern等人首次探寻了从众的神经机制。实验前,被试被告知他们即将与四位同学一同完成一个判断图片的任务。具体实验流程如下。首先,屏幕上会呈现两张三维立体图片,她/他们需要判断这两张图片上的图形是否是同一个图形。而后,其他四位同学的选择会出现在屏幕的最左侧。实验中,基线水平即在三分之一次实验中,四位同学的选择用符号“×”代替。剩余的实验试次中,四位同学一致地给出错误的答案与一致地给出正确的答案各占一半数量。为了让被试相信这四位同学是来参加实验的,不是主试故意安排的,Bern等还加入了六次实验试次:四位同学的答案以“2∶2”“3∶1”的比例呈现。研究者们为了考察从众行为是否会受到社会情境因素的影响,另增加了一部分的实验试次。在这部分试次中,被试看到的选择信息是来自四台电脑的。研究者发现,当四位同学的选择呈现在屏幕上时,被试的与心理旋转相关的脑区激活水平显著下降,激活水平低的脑区大部分都分布在前额部分。与此同时,右侧缘上回部显著激活。考察完从众效应后,研究者比较了两种信息来源:电脑提供的信息与真人提供的信息,他们发现:顶内沟处在真人提供信息中的激活程度显著大于电脑提供信息中的(Berns et al.,2005)。此外,当被试坚持自己的选择时,右侧杏仁核与右侧尾状核的顶部显著激活(Berns et al.,2005)。Berns在之后的另一从众实验中采用了音乐评定范式。研究结果显示,个体倾向于跟从团体的选择将会激活前脑岛与前扣带回,出现生理激发与负性情绪激活。当个体选择跟从团体,改变自己的行为时,腹侧纹状体的激活程度下降(Berns et al.,2010)。同时,双侧前脑岛及额极的激活表明:焦虑感伴随着从众行为的出现。研究者认为,个体因异于他人而产生焦虑情绪,这一焦虑情绪将会驱动个体跟随团体,改变自己先前的选择,做出从众行为(Berns et al.,2010)。
团体规范不仅影响个体的选择,同时也会影响个体对客观事物的价值评价。Campbell-Meiklejohn等设计了一项歌曲评定的实验。首先,研究者们要求28名被试各自提供自己喜欢但尚未购买的20首歌曲。在进行实验前,被试对自己选择的20首歌曲进行10点量表评分。而后,被试阅读两名音乐鉴赏专家的资料,并对是否信任两名音乐鉴赏专家的选择进行7点量表评分。在实验过程中,首先被试会看到两首歌曲的歌名分别显示在屏幕的左右两侧顶端。被试可以通过在歌曲名之下的区域左右移动自己的头像,来选择自己喜爱的歌曲。当被试选择结束后,他们会看到音乐鉴赏专家的选择。fMRI研究中发现,在被试面对音乐鉴赏专家的选择时,腹侧纹状体的激活量会显著增强(Campbell-Meiklejohn et al.,2010)。Campbell-Meiklejohn等研究者们认为,人们倾向于通过其他人对某一事物的反应做出对该事物的价值评价,例如,某一件事是危险的,某一食物是可食用的,某一类药物是应该摄取的等(Campbell-Meiklejohn et al.,2010)。世间万物都有属于它自身的价值,这种价值是人类与动物赋予它的。然而,这种价值却又不是一成不变的,它会受到社会的影响(Campbell-Meiklejohn et al.,2010)。此外,研究者们还发现,腹外侧前额叶皮层的激活水平与个体的从众倾向性有关(Campbell-Meiklejohn et al.,2010)。
同样,Zaki等研究者们也发现,团体规范会改变个体对客观事物的价值评价。Zaki等人采用了面孔评定范式,他们告知被试这是一项面孔吸引力调查,他们需要对180张女性面孔进行吸引力7点量表评分,这一项目已有上百人参加并给出了分数。在实验过程中,首先被试看到一副女性面孔图片,而后对于该面孔给出自己的评分,最后被试会看到已参加成员给出的平均分及自己的分数。在30试次中,团体成员的平均分高于被试的评分2分;又30试次中,团体成员的平均分低于被试的评分2分;60试次中,团体成员的平均分与被试相同;剩余60试次中,被试不知道团体成员的平均分。在这一实验半小时后,被试再次对这180张女性面孔图片进行吸引力评分。实验的行为数据显示,被试对面孔的吸引力评分会受到团体平均分的影响。当团体平均分高于被试的分数时,被试会倾向于认为该面孔吸引力较高。fMRI实验结果显示,团体给出的平均分会影响被试对面孔的吸引力评价,这一效应体现在伏核与眶额叶皮层的强激活量上(Zaki et al.,2011)。以往研究表明,这些脑区主要是涉及奖励学习及对客观事物进行价值评价(Hare,O’Doherty,Camerer,Schultz,and Rangel,2008;Padoa-Schioppa and Assad,2006;Tom et al.,2007;Kable and Glimcher,2007)。
从众心理导致个体对某个事物的评价发生变化,这一现象不仅出现在成年阶段,同样也出现在青少年阶段。Welborn等人邀请20名青少年到fMRI实验室内进行一项关于艺术图片评价的任务(Welborn et al.,2015)。首先,被试会看到其他同龄人给出的平均分。然后,图片会呈现在屏幕上,并且同龄人给出的平均分会呈现在图片下方。接着,被试需要在10秒内给出自己的分数,从0%到100%,0%表示被试完全不喜欢这幅图,100%表示被试非常喜欢这幅图。实验的数据结果显示,被试会倾向于给出与同龄人接近的分数。这一结果说明了,青少年阶段也存在着从众心理,同龄人对艺术图片的评价会影响青少年个体对该图片的价值评价(Welborn et al.,2015)。fMRI数据结果显示,当被试看到同龄人的评分时,双侧颞顶联合区、腹内侧前额叶皮层、右腹外侧前额叶皮层、背外侧前额叶皮层及补充运动区等脑区显著激活(Welborn et al.,2015)。以往研究表明,颞顶联合区及背外侧前额叶皮层与个体的心理理论有关(Hooker et al.,2008;Schnell et al.,2011;Van Overwalle and Baetens,2009)。腹外侧前额叶皮层与个体的自我控制有关(Campbell-Meiklejohn et al.,2010;Cohen and Lieberman,2010)。腹内侧前额叶皮层则与价值评价、奖励学习的心理过程有关(Zaki et al.,2011)。研究者认为,这一结果说明了,从众行为的内在机制是较为复杂的,它主要与心理理论、自我控制及奖励学习的心理过程有关。也就是说,只有当个体具有良好的心理理论能力、自我控制能力及奖励学习能力,才会做出从众行为。综合以上三个fMRI研究,研究者们认为,价值评价的改变是从众的重要条件,团体规范会改变个体对某一客观事物的价值评价,致使个体选择跟从团体规范(Campbell-Meiklejohn et al.,2010;Zaki et al.,2011)。
情绪一直是心理学研究中的热点。在人们日常的交往中,人们经常互相共享情绪体验,共同的情绪体验会促进个体之间的关系纽带(Rime,2009)。当个体对于某一情境进行情绪评价时,他会综合考虑其他人对该情境的情绪体验(Evers et al.,2005;Mumenthaler and Sander,2012;Manstead and Fischer,2001)。尽管有文献报告了这一情绪评价的从众效应,然而对于其内在的神经机制还不明确。为此,Prehn等人设计了一项fMRI实验(Prehn et al.,2015)。他们招募了40名被试,所有的被试分为20组,一组2名被试,一名被试在磁共振扫描室内完成fMRI实验,另一名被试则在扫描室外完成行为实验。该实验主要关注磁共振扫描室内的被试行为及大脑活动情况。主试告知被试,他们将会完成四个情绪图片的评价任务。任务之间的不同在于被试的评分角色:第一评分者、第二评分者及独立评分者。实验分为四部分,第一部分被试独立完成情绪图片的评分任务;第二部分被试作为第一评分者,先于另一名被试对某一情绪图片进行唤醒度评分;第三部分与第四部分被试作为第二评分者,另一名被试先对某一情绪图片进行唤醒度评分,而后被试再给出自己的分数。在被试为第二评分者的实验中,另一名被试的分数分为三个水平:(1)低于IAPS 2分;(2)高于IAPS 2分;(3)与IAPS持平。实验过程中,首先屏幕显示注视点2-16秒,随后屏幕会告知被试他是独立、第一或者第二评分者。以被试作为第二评分者为例,首先,屏幕正下方会呈现评分量表线,持续时间为3.5秒。之后,评分量表线上会显示扫描室外同组的另一名被试的分数,持续时间为6秒。这一阶段能够让被试通过该分数,对即将评价的图片有一种唤醒度预期。接着,图片会呈现在屏幕上,持续时间为1.5秒。最后,被试有6秒的反应时间对该图片进行唤醒度的评分。实验的行为数据结果显示,在被试作为第二评分者的部分中,被试的评分在低于IAPS的条件中显著低于高于IAPS的条件,也就是说被试对情绪图片的唤醒度评价会受到同组成员的评分影响,表现出情绪评价的从众效应。fMRI数据结果显示,当被试看到另一名被试的评分高于IAPS时,双侧脑岛与背外侧前额叶皮层显著被激活。相关研究表明,脑岛的激活与对于厌恶刺激的预期有关(Herwig et al.,2007;Carlson et al.,2011;Simmons et al.,2011;Denny et al.,2014)。在被试对情绪图片进行唤醒度评分时,如果另一名被试对该图片给出的唤醒度分数越高,被试的纹状体的激活程度越低。多个从众效应实验报告了纹状体与从众行为的关系(Bern et al.,2010;Campbell-Meiklejohn et al.,2011;Klucharev et al.,2011;Zaki et al.,2011)。研究者认为,纹状体与奖赏、预测误差有关(Klucharev et al.,2009,2011)。纹状体的激活预示着个体对于改变自己的选择,跟从他人选择的一种内心倾向性。对于如何解释该实验中纹状体的活动水平,研究者们推测,是因为当另一名被试的评分显著不同于IAPS时,被试的从众倾向性显著增强。此外,Perhn等为了考察杏仁核是否在高于IAPS、低于IAPS与和IAPS持平这三种条件之间有显著差异,以杏仁核作为种子点,作了2(左半球、右半球)×3(高于IAPS、低于IAPS、持平)方差分析。然而,方差分析结果显示,杏仁核的活动水平并不受到这三种条件的影响。综合该实验的行为数据及fMRI数据,研究者们认为,他人的情绪体验会影响个体自身的情绪体验,所以其他相关的情绪研究应该将从众效应纳入实验设计考虑之中。
近年来,外界信息对个体记忆的影响这一研究已经成为热门。研究者提出,记忆会受到群体压力的影响,这一现象可称为记忆从众。为了探究记忆从众的神经机制,Edelson等研究者们(2011)进行了一项耗时两周的记忆实验。他们招收了30名成年人作为被试。在第一天,主试将被试分为5人一组,5位被试一同观看一段电影片段。两天后,所有被试被邀请回到实验室,她/他们在主试的指导下,单独完成一份记忆测验。在这一记忆测验中,他们需要进行记忆判断并且给出自己的信心水平。实验第七天,主试再次邀请所有被试来到功能性磁共振实验室。被试需要在磁共振仪器内完成与之前相同的记忆测验。在实验过程中,首先屏幕呈现记忆问题。而后,被试会看到其他四名组员的选择。组员选择呈现结束后,则要求被试回答该问题并对自己的选择进行自信心评分。到了实验的第十四天,被试再次被邀请回实验室。主试告诉所有被试,之前实验中为她/他们提供的组员选择其实是电脑随机生成的。接着,被试被告知需要完成最后一次记忆测验。实验行为数据显示,被试对影片的记忆受到团体选择的影响,被试在68.3%的社会影响试次中选择跟从团体成员的选择,给出错误的答案。研究者将这一百分比与无社会影响试次(15.5%)进行比较,得出结论:被试之所以给出错误的答案,是因为从众效应而非记忆错误或遗忘。在最后一阶段测试中,主试告知被试上一次测试中,被试看到的答案是随机的选项,而后让被试再次进行回忆测试。然而,在最后一阶段测试中,被试在59.2%的试次中改正了自己的答案,还有40.8%的试次中依旧给出了错误的答案。这一结果说明,记忆从众效应并非是暂时的,它可能会影响个体的长时记忆,造成长时记忆错误。功能性磁共振数据显示,团体选择也影响了记忆在大脑中的神经表征。以往记忆相关研究表明,海马体与记忆有关,杏仁核与社会情绪有关(Dolcos et al.,2004;Dolan,2002;Bickart et al.,2011;Adolphs,2003)。所以,研究者将左右双侧海马体顶部、双侧海马旁回、双侧海马体后端及杏仁核作为种子点,比较了造成长时记忆错误的从众试次、造成暂时记忆错误的从众试次及非从众试次。结果发现,在造成长时记忆错误的试次中,除了左侧海马体后端,其他脑区的激活水平都显著增强。而对比了造成暂时记忆错误的试次与非从众试次,则未发现任何差异。为了进一步考察造成长时记忆错误的试次与造成暂时记忆错误的试次有何不同,研究者做了全脑分析。结果发现,在从众效应造成长时记忆错误的试次中,左侧杏仁核、右侧海马体、右侧海马旁回及颞中回激活水平显著提高。此外,研究者还进行了功能连接分析。他们发现,在造成长时记忆错误的试次中,杏仁核与海马体的连接性增强,这预示着被试的长时记忆由于从众效应的影响而发生了改变。该研究结果说明,从众效应会影响个体的记忆,甚至会造成个体的长时记忆错误。这一效应在神经机制层面的表征脑区主要在于海马体与杏仁核。
在以往与从众有关的实验研究中,如何将信息型从众行为与规范型从众行为进行区分是一大研究难点。Mason等人认为,规范型从众行为可能与心理理论相关的脑区的活动水平有关,而信息型从众行为可能与奖赏加工相关脑区的激活有关(Mason,Dyer and Norton,2009)。为了验证这一假设,研究者们设计了一项实验。首先,研究者们选取了30个符号作为实验素材。其中10个为接受度高的符号,10个为接受度低的符号,剩下的10个则作为新符号。在被试进行fMRI任务之前,先让被试通过一个任务知道哪些符号是属于接受度高的,哪些符号是属于接受度低的。而后,被试进行fMRI任务。主试告知被试,在fMRI任务中,他们将会看到符号,有些符号是他们已经见过的,有些是新符号。被试所要做的就是当他们看到一个符合出现了两次时,就按下按键。fMRI数据结果显示,相较于新符号,当被试看到接受度高或接受度低的符号时,内侧前额叶皮层被显著激活。而相较于接受度低的符号,当被试看到接受度高的符号时,纹状体与额上回被显著激活。以往研究表明,内侧前额叶皮层与心理理论有关,当人们对他人的态度与心理进行推测时,内侧前额叶皮层的激活水平会被显著提高(Amodio and Frith,2006)。纹状体与奖励学习有关。研究者认为,这一结果验证了他们的假设:社会影响过程中,规范型从众与心理理论相关的脑区的激活有关,而信息型从众则与奖励加工有关的脑区的激活水平有关。
Stallen等采用一项直觉判断实验对于个体的团体内从众与团体外从众行为进行研究(Stallen et al.,2013)。在实验中,首先被试会看到电脑屏幕上呈现若干数量的圆点,被试所要做的就是估计圆点的数量。圆点呈现结束后,被试有2秒到6秒的时间思考自己的答案。接着,被试会看到之前的一名被试给出的答案。这名被试可能是与他同一组的成员,也可能是其他组的成员。看完前一名被试的选择后,被试需要给出答案。行为数据结果显示,被试更倾向于跟从团体内其他成员的选择(Stallen et al.,2013)。通过分析fMRI数据,研究者们发现,跟从团体内成员的选择与心理理论有关,当个体选择跟从团体内的其他成员时,心理理论相关脑区被显著激活。此外,纹状体与前扣带回也与团体内从众有关(Stallen et al.,2013)。
Wei等通过采用最后通牒博弈范式的变式,利用功能性磁共振技术,探究了公平偏好中的从众现象(Wei et al.,2013)。实验过程主要是在最后通牒博弈中加入其他四名成员的选择,形成影响被试行为的从众情境。首先,被试看到一个分配方案,并在3秒内做出自己的选择。而后,被试看到其他四名同组成员的选择,持续时间为2秒。接着,被试再次看到分配方案并做出第二次选择。也就是说,在单次试次中,被试需要对同一个分配方案做两次选择。实验设计包括两个实验因素:方案类型与其他成员的选择(4名被试并不是真实存在的,选择是事先设定好的)。方案类型分为公平的分配方案(分配比例接近5∶5或6∶4)与不公平的分配方案(分配比例接近2∶8或1∶9)。其他成员的选择分为四个水平:水平一为四名或三名成员都选择了接受方案,水平二为四名或三名成员都选择了拒绝方案,水平三为无信息(基线水平),水平四为2名成员选择了接受方案,另两名成员选择了拒绝方案。数据分析主要着重于前三种水平。行为数据结果显示,被试的选择会受到其他四名成员的影响。当被试看到自己的选择与其他四名成员的选择不同时,更倾向于在第二次决策中改变自己的选择(Wei et al.,2013)。fMRI数据结果显示,当被试看到自己的选择与其他四名同组成员的选择不同时,双侧脑岛、前额叶皮层、右侧颞中回、双侧额中回的激活水平被显著提高(Wei et al.,2013)。为了进一步确定从众行为的神经机制,研究者们将所有的实验试次分为从众试次与未从众试次,并进行了比较分析。结果发现,相较于未从众试次,中脑、双侧颞中回、脑岛、前额叶皮层、双侧顶下小叶的激活水平显著提高(Wei et al.,2013)。以往研究表明,这些脑区都与行为改变有关(Falk et al.,2010)。此外,前额叶皮层与个体调整自身的行为、基于错误的学习机制及误差学习有关(Botvinick et al.,2001;Ridderinkhof et al.,2004;Preuschoff et al.,2008;Singer et al.,2009;Alexander and Brown,2010;Cavanagh et al.,2010;Izuma et al.,2010;Ullsperger et al.,2010)。并且,前额叶皮层与额中回在规范违反的加工过程中也起到了关键的作用(Berthoz et al.,2002)。研究者发现,前额叶皮层受损的病患对于社会规范失去敏感性,对于自己的行为是否符合社会规范变得漠不关心(Beer et al.,2003)。以上的结果说明,公平偏好从众的神经机制与违反社会规范及行为适应的神经机制十分相似。也就是说,个体将团体成员的选择看作是一种规范,并且他们倾向于跟从团体的选择。当个体察觉自己的行为与团体规范是相冲突的时候,会调整自身的行为,跟从团体成员的选择,遵守团体规范。
此外,研究者们发现,从众的神经机制类似于强化学习。Klucharev与其合作者采用面孔吸引力评定实验来考察从众效应(Klucharev et al.,2009)。第一部分fMRI实验中,被试需要对多张面孔进行吸引力评分。在被试做出回答后,电脑会给出一个分数,这一分数来自全欧洲大数据库。fMRI实验结束后,被试需要完成一个行为实验。这一行为实验与fMRI实验不同之处在于:不提供大数据库分数给被试。通过第二次的行为实验,研究者们可以考察个体是否出现从众行为。如果从众行为存在,那么被试的分数会根据大数据库分数而发生改变,他们给出的分数会接近大数据库分数。研究者发现,当个体发觉自己与团体存在冲突时,位于后内侧额叶皮质的扣带区喙部会被显著激活,如同于强化学习中的预测错误信号(Klucharev et al.,2009)。此外,研究者根据被试的从众概率,将被试分为从众组与非从众组。通过分析扣带区喙部与腹侧纹状体的激活强度发现,从众组的扣带区喙部与腹侧纹状体的激活强度显著大于未从众组(Klucharev et al.,2009)。为了进一步解释内侧额叶皮质在从众行为中的作用,Klucharev同样使用了面孔评定范式,采用重复性经颅磁刺激技术,通过调节内侧额叶皮质的激活量来控制个体的从众行为(Klucharev et al.,2011)。实验结果显示,内侧额叶皮质激活水平的降低会扰乱支撑效能监控与社会学习的神经网络,从而导致从众行为的减少(Klucharev et al.,2011)。强化学习理论认为,中脑多巴胺信号会调节内侧额叶皮质的激活强度(Holroyd and Coles,2002;Matsumoto et al.,2007)。也就是说,内侧额叶皮质的激活量与行为反馈是相关的。并且,先前的部分研究证实内侧额叶皮质与错误可能性预测(Brown and Braver,2005)、错误加工(Holroyd and Coles,2002;Ridderinkhof et al.,2004;Matsumoto et al.,2007)、冲突检测(Botvinick et al.,2001)、违背规范(Berthoz,Armony,Blair,and Dolan,2002)有关。所以,其在从众实验中的激活情况,说明从众行为的神经机制是类似于强化学习的,违背团体规范会诱发预测误差信号,预测误差信号会进一步引发个体的从众行为(Klucharev et al.,2009;Klucharev et al.,2011)。另一方面,内侧额叶皮质与认知失调(van Veen et al.,2009;Izuma et al.,2010)、心理理论(Gallagher and Frith,2003;Amodio and Frith,2006)有关。Klucharev 等认为,违背团体规范会引发个体出现认知失调(Klucharev et al.,2011)。为了避免认知失调,人们会改变行为,选择与团体规范一致的行为。
同样,Nook等人采用功能性磁共振技术,考察了从众效应是否影响个体对各类食物的评价。他们邀请了25位斯坦福大学本科生到实验室对150张食物图片进行两次8点量表评分。实验开始前四个小时,被试不能进食。第一次评分过程中,首先被试对食物进行评分,时间为3秒,而后呈现团体成员评价的平均分。团体成员的平均分被分为三个水平,第一个水平是与被试的评分相同,第二个水平是高于被试给出的分数1-3分,第三个水平则是低于被试给出的分数1-3分。在被试完成了评分后,等待五分钟,紧接着让被试对同样的实物图片进行第二次评分。在第二次评分时,被试看不到团体成员的平均分。行为数据结果显示,团体成员的平均分对被试的第二次评分产生了影响。在第二次评分中,被试会根据团体成员的平均分调整自己给出的分数,倾向于与团体成员的评分保持一致。fMRI数据显示,相较于团体成员评分与个体不一致的条件,当被试看到自己给出的分数与团体成员的平均分是一致的时候,伏核、脑岛、颞上回、颞中回的激活水平显著提高。研究者们还发现,被试的伏核的激活程度与其从众行为呈正相关关系,即当被试看到自己的分数与团体成员的不一致时,伏核激活强度越强,其在第二次评分中改变自己的评分倾向性就越强。伏核主要与奖励学习、预测误差有关(Hare et al.,2008)。研究者们认为,这一结果说明了人们认为,与团体保持一致是一种奖励。正是这一内部动机驱使了被试跟从团体成员的意见,在第二次评分时改变自己对食物的评分。这一研究结果与Klucharev等的研究结果一致:从众效应的神经机制与强化学习中的预测误差的神经机制是相似的(Klucharev et al.,2009,2011)。此外,研究者们还对被试在第二次评分时的大脑活动情况进行了分析。他们发现,在第二次评分时,相较于团体成员评分较低的食物图片,被试在对团体成员评分较高的食物图片进行评分时,腹内侧前额叶皮层被显著激活。以往研究表明,腹内侧前额叶皮层与价值评定加工有关(Zaki et al.,2011;Campbell-Meiklejohn et al.,2010)。研究认为,结合被试的从众行为及腹内侧前额叶皮层的激活情况,说明被试内心对食物的价值评价会受到团体评分的影响。这说明了,被试在食物评价任务中的从众行为更有可能是属于信息型从众——被试接受了团体的意见,而非单纯的模仿。
经典条件反射学说起源于著名的神经生理学家巴普洛夫所做的一个实验。实验中,巴普洛夫利用狗进食之前会分泌唾液的现象,在每次喂食之前都给出铃声刺激。久而久之,狗在听到铃声后都会分泌唾液,这种现象被称为“经典条件反射”。巴普洛夫认为,这种条件反射行为之所以会出现是因为唾液腺体与接收铃声的神经细胞建立了连接,而这一连接建立的条件则是狗的经验,即铃声之后就可以进食(Pavlov,2010)。随后,研究者使用数学公式来阐明这一规律(Bush and Mosteller,1951a,1951b)。他们认为,狗分泌唾液的概率可以由一个迭代方程式来计算:Anext_trial=Alast_trial+α(Rcurrent_trial-Alast_trial)。其中,Anext_trial指的是下一次实验试次中,狗听到铃声后分泌唾液的概率。狗在本试次中所得的预测误差乘以范围在0-1的学习率α之后,与上一次试次的A值相加,便可得到下一次试次的A值。其中的预测误差指的是,狗所期望的奖励与其在实际中所得奖励之间的差值。这一方程式首次采用迭代错误规则来阐明强化学习的内在机制,为强化学习的研究奠定了一定的基础。
计算神经科学的研究者认为,强化学习理论为解释奖励学习与决策行为的神经机制提供了一个全新的框架(Schultz et al.,1997;Dayan and Balleine,2002;Montague and Berns,2002)。在强化学习模型中,预测误差对于形成并调节个体的行为与强化物之间的关系起着十分重要的作用(Montague and Berns,2002)。预测误差指的是预测结果与实得结果之间的差值,个体可以根据预测误差来决定是否需要调整行为或决策,也就是说,较大的预测误差值会促使个体改变未来的行为或决策(Schultz,2006)。预测误差可分为正性与负性,正性预测误差指的是行为的结果比预期的好,而负性预测误差指的是行为的结果比预期的差(Holroyd and Coles,2002)。研究者认为,从众行为是目标导向行为,其目的包括获得社会认可、提高行为准确性、避免团体排斥及错误行为带来的惩罚(Cialdini and Goldstein,2004)。心理学关注的是人们为了获得所属团体的认可与支持而选择从众(Cialdini and Goldstein,2004),而行为经济学更多关注的是人们为了避免因违反团体规范而受到惩罚,从而选择从众(Fehr and Fischbacher,2004)。虽然这两种研究取向有所不同,但它们都说明:从众行为的基础是强化学习机制。计算神经科学研究者认为,完成目标导向行为的必要条件是个体持续不断地对行为进行监控与调整(Montague et al.,2006)。即个体根据行为的结果不断调整、优化行为以期获得自身满意的反馈。在这种强化学习过程中,个体将预测误差作为调整行为的信号,根据预测误差值调整行为与决策。然而,与团体规范的冲突并不是一种传统意义上的错误行为,研究者认为它仅仅是一种偏离团体规范的行为(Montague et al.,2007)。个体做出从众行为的前提条件是个体察觉到自己的行为是偏离于团体规范的(Montague et al.,2007)。所以,研究者们假设,当个体察觉到自身的行为偏离于团体规范时,在强化学习中负责加工预测误差的神经元就会被激活(Klucharev et al.,2009)。也就是说,违反团体规范可视为预测误差,它会促使个体改变行为与决策,从而与团体规范保持一致,这一过程就是从众。
事件相关电位技术具有血流动力学所缺乏的高时间分辨率,研究者常将它作为fMRI的重要补充。Chen等研究者(2012)采用了事件相关电位技术,对于从众行为的时间进程进行了研究。他们根据Asch的经典线条判断实验,改编了一个适用于事件相关电位技术的线条判断任务。在实验中,被试需要判断A、B线条的长度是否相等。被试有两次机会进行选择。在进行第二次判断之前,被试将会看见其他4名被试的选择(4名被试并不存在,选择是事先设定好的)。其他4名被试的选择分为三个水平,第一个水平为三至四名成员的选择与被试相同,第二个水平为三至四名成员的选择与被试不同,第三个水平为2名成员的选择与被试不同,其他2名成员的选择则与被试相同。实验的行为数据结果显示,当被试看到其他四名成员的选择与自己的选择不同时,会倾向于改变自己的选择,跟从其他四名成员的选择。ERP数据结果显示,当被试发现自己的选择与其他四名成员的选择不一致时,会出现MFN波(Chen et al.,2012)。MFN(Medial Frontal Negativity)也被称为FRN——反馈相关负波,它是来自额叶中部的负波,时间窗口为200-350毫秒,主要反映了大脑的反馈评估及效能监控功能。相较于正性反馈,当个体得到令人不悦的负性反馈时,MFN波幅会显著增大。随着被试与其他4名被试的选择不一致程度越高,MFN波幅越大。为了进一步探究反馈相关负波与从众行为的关系,研究者们根据被试是否改变选择将被试分为从众组与未从众组。通过对两组进行比较,他们发现:从众组的MFN波幅比未从众组更大(Chen et al.,2012)。并且,从众倾向高的个体相比从众倾向低的个体,其MFN的波幅更大(Chen et al.,2012)。此外,Shestakova等使用了Klucharev从众实验中的面孔评定范式,要求被试对不同的面孔进行吸引力评定,而后被试会看到团体评出的平均分。在第一阶段后,被试再次对所有的面孔图片进行了评定。行为数据结果与Klucharev等人的研究相符(Klucharev et al.,2009)。被试在第二次评分时的分数会受到团体评分的影响。当面孔图片获得了较低的吸引力分数时,被试也会下调他们给出的分数。而当面孔图片获得了较高的吸引力分数时,被试也会相应地上调他们给出的分数(Shestakova et al.,2012)。通过分析脑电数据,研究者们发现,当个体察觉自身与团体的评分存在冲突时,会出现反馈相关负波(Shestakova et al.,2012)。研究者认为,从众行为出现的一个关键因素就是个体能够察觉到自己的行为与其他人是不相符的,这种不相符类似于一种“错误信号”。也就是说,被试首先要接收到这一“错误信号”,然后有改变自己行为的动机,才能根据团体规范,调整自己的行为(Montague and Lohrenz,2007)。
以往研究表明,反馈相关负波与错误检测及行为的执行控制有关(Holroyd and Coles,2002;Nieuwenhuis et al.,2004;Nieuwenhuis et al.,2007)。在Flanker实验范式的变式中,被试观察到他人的错误反应时会出现反馈相关负波(van Schie et al.,2004);在赌博任务中,被试观察他人行为的反馈也同样会出现反馈相关负波(Yu and Zhou,2006);Cohen在研究中发现,可以通过反馈相关负波的波幅来预测被试在下一次是否会改变选择(Cohen and Ranaganath,2007)。这一系列的研究表明,反馈相关负波与强化学习中的预测误差有关(Donkers et al.,2005;Hajcak et al.,2007)。强化学习理论认为,反馈相关负波反映了中脑多巴胺系统对预测误差的加工,中脑多巴胺系统将预测误差信号传递至前扣带回区,从而前扣带回区可以根据行为的结果来调整行为或决策(Holroyd et al.,2002;Nieuwenhuis et al.,2004)。从众研究中反馈相关负波的出现说明,个体将违背团体规范视为预测误差,这一预测误差信号会强化个体在之后改变行为或决策(Chen et al.,2012;Shestakova et al.,2012)。个体给予这一预测误差越大的权重,越有可能在之后改变行为或决策(Chen et al.,2012)。这一结果与Klucharev等人的研究结果一致:从众行为的神经机制与强化学习中的预测误差类似(Klucharev et al.,2009)。
回顾过去关于从众行为的神经机制研究,我们发现从众行为与奖励加工、冲突检测及预测误差的神经机制有着密不可分的关系。根据从众的类型,团体规范对个体的影响可分为信息型与规范型。信息型影响说明个体将团体规范作为有效的决策信息来源,它表现在团体规范激活奖励加工相关的脑区,例如纹状体;规范型影响说明个体为了获得社会支持,避免违背团体规范而选择从众,它表现在团体规范激活冲突检测相关的脑区,例如内侧额叶皮质(Mason et al.,2009)。从众过程中,预测误差起到警示信号作用,个体偏离社会规范时会产生预测误差信号,这一信号传递至与行为执行相关的脑区,从而使得个体通过改变自己的行为或决策来达到与社会规范保持一致的目的(Klucharev et al.,2009;Klucharev et al.,2011;Chen et al.,2012;Shestakova et al.,2012)。从众的神经机制研究主要从以下两个方面丰富了从众研究领域。第一,传统从众理论虽然将从众分为两类:规范型与信息型,但在实际研究中很难将二者完全区分。然而,从众的神经机制研究可以从神经生理层面将二者加以区分:规范型从众体现在对社会规范敏感相关的脑区,例如内侧前额叶皮质;信息型从众则体现在与奖励相关的脑区,例如纹状体(Mason et al.,2009)。第二,从众的神经机制研究揭示了从众行为产生的内在因素。传统的从众研究关注的是从众行为的外在因素,包括从众行为产生的外界条件,如团体规模等。而探寻从众行为的内在神经机制可以让我们更好地了解从众产生的内在条件,包括执行监控系统、预测误差信号等。
一方面将强化学习理论引入解释从众现象,有利于我们更加了解从众行为的产生机制;另一方面也有利于开展针对违反社会规范的特殊人群研究,例如相关脑区受损致使个体对于社会规范的敏感度降低等。
现阶段的研究还存在着一些问题尚未解决。首先,实验中的从众行为与非从众行为在出现次数上并不相等,从众行为的数量总体上少于非从众行为。所以,在神经机制研究中,研究者无法将是否从众设为组间变量对实验试次进行分类比较。其次,倘若研究者不考虑二者数量上的差异,根据是否从众对试次进行分类比较,则无法保证数据结果的准确性。再次,实验中为被试提供的团体信息可能对被试有暗示作用。身处实验室的被试可能会存在实验者效应或霍桑效应。最后,文化会影响从众行为。不同文化下的个体对于社会规范的态度是不同的。例如,相较于倡导个人主义价值观的文化背景,倡导集体主义价值观文化背景下的个体可能更倾向于选择从众。然而,现有的神经机制研究中尚未讨论过文化对从众的影响,被试所处的文化背景不同可能会对研究结果的普适性产生影响。