第二节 群体行动机制设计类别与效应
实验经济学特别是公共品博弈实验的引入,使我们得以从个体层面运用控制性的实验方法对公共品供给问题予以定量分析,在此基础上发现其内在规律进而可以为公共品供给的治理提供有效机制。传统的公共品博弈实验模型对此描述如下,假设共有n个人参加实验,实验员给予每个人初始y个筹码的禀赋,所有人同时向某公共池(公共项目)进行投资,gi表示第i个人投入的筹码量,投资完毕后,无论参与者投资多少,他们都将获得同等的回报,回报额为公共池中的投资总额乘以一个系数λ。这样每个人得到的物质效用就是个体原来的初始禀赋减去投进公共池中的筹码再加上从公共池中得到的回报,个体i的效用函数为:
同时该轮中群体的收益是:
其中系数λ被定义为MPCR(Marginal Per Capital Return),即边际个体回报,这里设定0<λ<1<nλ,此时对个体i来说由于,故在每一轮中个体i的最优策略是使得gi最小化,即投资水平为零。但从群体的总收益角度来说,每个人投资的最大化是最优策略,因为。
按照该博弈模型,搭便车策略始终是参与者的一个纳什均衡策略,但是现实生活的直觉和观察往往与此相悖。道斯和泰勒(Dawes and Thaler,1988)就指出,公共品中的搭便车问题一方面肯定会存在,但在另一方面肯定与标准的理论预测不符。安德里尼(Andreoni,1988),艾萨克和沃克(Isaac and Walker,1988)等大量传统公共品博弈实验表明,人们即不会像自利模型预测的那样会选择全部卸责,也不会选择使整个社会最优的捐献全部禀赋的策略,这从另一个侧面说明合作在一个社会两难困境中确实存在。莱德亚德(1995)在其关于公共品博弈实验的综述文献中总结到:大量相关实验中的一个一致结果是,在实验初始时人们一般会投资(捐献)大约一半的初始禀赋,但是随着实验的重复进行,其投资水平会逐渐降低,并最终接近于自利模型预测的零水平投资。早期大量的公共品实验研究结果所揭示的一个基本规律是:人们的自愿合作行为显著存在而非人人搭便车。
在经济人自利假设条件下,搭便车策略始终是公共品博弈中参与者的纳什均衡策略,这是私人提供公共品的无效性和由政府来供给公共品必然性的理论基础。但是正如莱德亚德(1995)对20世纪70年代开始到90年代中期为止的公共品博弈文献的综述中所总结的,在一次性和有限重复实验阶段,被试的投资额一般处于帕累托最优水平和搭便车水平之间,平均值大约占被试全部禀赋水平的40%~60%,这与经济人假设下的零投资预测水平形成鲜明的对比。也就是说,在两难的社会困境中,大量的公共品博弈实验依然表明人类会形成自发的合作秩序。对此莱德亚德(1995)的解释是有两种:(1)坚持认为这仍然属于自利假设范畴,认为实验室环境下,参与者通常会对博弈激励机制产生混淆或者误差(confusion/error),所以才会出现正的贡献。而随着实验进行,参与者会通过学习来修正认知找到最优策略。但是很明显在众多文献中都存在期数效应(period effect)。(2)参与者存在不同程度的社会偏好(social preference),比如利他、互惠、不平等厌恶(Rabin,1993)。乔杜里(Chaudhuri,2011)对1995年之后的大量后续公共品博弈实验研究进行了新的梳理,进而总结和揭示了关于人类公共品供给问题中另外两个具有代表性的基本规律,即群体中条件合作者的存在是人们形成自愿合作的基础,而利他惩罚能有效解决人类合作的脆弱性问题。
一、惩罚机制
人们的自愿合作行为具有脆弱性特征。这种“脆弱性”是指随着实验重复进行,公共品自愿合作水平会逐渐下降。这种现象也被称为公共品投资额或合作水平的“期数效应”,即随着期数增加,人们的自愿合作水平会呈现下降趋势,即使是在单期重复甚至被试随机匹配的情况下,这种期数效应也显著存在。并且越接近博弈的后期,人们的自愿合作水平越接近于经济人假设的零水平状态,即搭便车行为侵入并占据主导优势。我们需要如何解决人类合作的脆弱性特性?随着公共品博弈实验研究的不断深入,乔杜里(2011)在综述中发现利他惩罚往往是解决公共品自愿合作行为脆弱性的一种有效机制。利他惩罚虽然对于个体来说是有代价的,但是一系列的公共品实验研究揭示个体对搭便车者进行惩罚大量存在,并且显著地提升了群体的合作水平(Yamagishi,1986;Ostrom et al,1992;Fehr & Gächter,2000;Carpenter,2004,2007 a,b;Masclet et al,2003;Hermann &Thoni,2008)。对惩罚机制研究最为经典的为费尔和盖希特(Fehr and Gächter,2000,2002)。在他们的实验中,利用Andreoni(1988)的“伙伴”与“陌生人”实验设置,参与人被分在4人一组的小组中,他们要参加20轮实验,其中头十轮没有惩罚机制,而后十轮则是带有惩罚机制的公共品实验。头十轮实验就是一个标准VCM(Voluntary Contribution Mechanism)实验,每人有20个禀赋,MPCR是0.4。
在后十轮中每一轮分为两个阶段,在第一个阶段,参与者要进行一个标准的VCM实验,如上述的一般情况;在第二个阶段,参与者在看到其他人的贡献之后可以选择惩罚组内其他成员。被惩罚者每被惩罚一个惩罚点,就意味着其收益减少10%,同时实施惩罚对于施罚者同样是有成本的。实验结果发现不带惩罚机制的实验中对公共品的平均贡献水平是19%,而带有惩罚机制的实验中对公共品的贡献水平是58%;同时在最后一轮中不带惩罚机制的公共品贡献率是10%,而带有惩罚机制的公共品贡献率达到62%。而按照理性模型,人们的标准策略是在不带惩罚时捐献为零,而在惩罚时选择不惩罚,他们的实验数据均推翻了这两个结论。尤其在最后一轮,人们的捐献水平还保持一个较高位置。费尔和盖希特(2000,2002)是在惩罚成本与技术、惩罚制度外生给定的前提下研究惩罚机制对群体合作行为的影响,并且没有考虑惩罚制度外生参数的变动,以及反惩罚行为与“二阶段搭便车”行为对合作行为的影响,后来,学者们从惩罚制度外生参数变动,二阶段惩罚、惩罚技术与惩罚制度内生性的角度拓展与深化费尔和盖稀特(2000)的研究。
(一)外生性惩罚机制
安德森和普特曼(Anderson and Putterman,2006)在费尔和盖希特(2000)实验设计基础上,同时排除对惩罚的策略性刺激,只使用了陌生人的实验设置,引入不同惩罚成本(对被惩罚者的单位惩罚需要惩罚者付出的代价)来研究惩罚对合作行为的影响。研究发现,对于不同的惩罚成本,针对搭便车者的非策略性惩罚行为确实普遍存在,而且被试的贡献水平低于小组平均贡献水平越多,他接收到的惩罚点数就越多;在控制了搭便车者的行为水平以后,惩罚行为水平与惩罚成本负相关,这说明惩罚决策服从需求法则。在费尔和盖希特(2000)实验设计基础上,卡彭特(Carpenter,2007b)进行了类似的研究,与费尔和盖希特(2000)的不同在于,他们采用5个不同的惩罚成本,同时每一个参与者只能惩罚他目前所在组内的一名成员。研究发现,惩罚成本提高10%,惩罚行为需求减少8%,而降低惩罚成本,增加了对搭便车者的惩罚威胁,提高了小组的平均合作水平。不过两者的研究结果稍有差异,安德森和普特曼(2006)的研究表明对于惩罚的需求可能是有弹性的,不过卡彭特(2007b)的研究得出在控制搭便车者的行为后,对于惩罚的需求可能是缺乏弹性的。尼克福瑞基斯和诺曼(Nikiforakis and Normann,2005)研究了有成本惩罚的成本效率问题,他们设计了4个不同的实验条件,每一个实验条件中都有相同的惩罚成本和不同的惩罚度,最后他们发现惩罚的效率和平均贡献率之间有一个单调关系:当效率提高时,平均贡献率也在提高,所以总是存在一个最优的惩罚度以及与之相匹配的平均贡献率。也就是,高贡献下的惩罚度并不意味着是有效率的惩罚度。
不过,作为比较静态分析,上文有关惩罚机制对合作行为的影响仅改变了费尔和盖希特(2000)中惩罚制度中的参数,没有考虑团队结构以及博弈期数的影响,卡彭特(2007a)检验了团队规模,公共品生产率和组内成员监控能力的关系,发现惩罚机制对于团队结构是很敏感的,当每一个组内成员能够监控并惩罚组内其他成员时,贡献率是很高的,但是当组内成员被允许监视并惩罚仅仅组内一半的成员时,这时候的惩罚是最有效率的,在这种情况下,贡献率几乎等同于每一个人相互监督,但是惩罚会使得搭便车者尽可能多的贡献,然而当组内成员只能监控并惩罚组内其中一人时,惩罚对搭便车者不再是一个有效威慑,这时候贡献率就会跌落到同没有惩罚机制下的情况一样。盖希特(2008)在费尔和盖希特(2000)模型的基础上改变了博弈的期数,研究发现惩罚机制对合作水平的影响依赖于公共品博弈的期数,即惩罚机制中的时间效应,在公共品博弈期数越多,Fehr和Gächter(2000)模型中惩罚机制对合作行为影响越明显。
上述有关惩罚机制对合作行为的影响仅限于一个有成本的惩罚阶段,而且惩罚仅针对有关公共品的贡献决策,因此,惩罚者可以免除被报复,而在惩罚阶段中没有对“搭便车者”实施惩罚行为的被试(“二阶搭便车者”)也可以免除被惩罚。假如存在对惩罚者与“二阶搭便车者”的报复机会,那么群体中惩罚行为将受到影响,从而影响群体的合作水平。
在研究二阶惩罚中的反惩罚行为(惩罚者只对一阶惩罚中惩罚过自己的被试实施惩罚)对合作水平的影响时,尼克福瑞基斯(2008)设计了一个实验,在这个实验中有两个不同惩罚机制,一个惩罚机制等同于费尔和盖希特(2000)的设计,另一个惩罚机制中在原有惩罚机制中增加了一个反惩罚的第三阶段,在这个第三阶段中每一个参与者会被告知自己被惩罚的点数并给予一个报复给予自己惩罚的成员的机会,从而发现由于二阶惩罚行为的出现降低了第二阶段对搭便车者的惩罚行为,二阶惩罚实验设置降低了合作水平。而辛尼瓦古马等(Cinyabuguma, et al.,2005,后文简称CPP)研究了二阶惩罚机会中对“二阶搭便车者”的惩罚行为,他们设计了一个实验,在这个实验中,参与者将观察到在惩罚阶段成员们所惩罚的对象是高于平均贡献率的成员,还是等同于平均贡献率或者低于平均贡献率的成员,同样地,在这个实验中也设置了第三阶段,在这个阶段参与人可以惩罚那些在第二阶段惩罚高于平均贡献率的成员。研究发现,由于这种惩罚行为提高了阶段二中针对“一阶搭便车者”的惩罚行为,提高贡献阶段的合作水平,因此,具有二阶惩罚机会的群体合作水平高于VCM与一阶惩罚实验设置中的合作水平。而CPP(2005)与尼克福瑞基斯(2008)在研究结论上的差异主要源于实验设置中的信息差异。
德南-博蒙特等(Denant-Boemont et al.,2007)以费尔和盖希特(2000)实验设计为基础,综合CPP(2005)尼克福瑞基斯(2008)的实验设置,研究反惩罚与对“二阶搭便车者”的惩罚对合作水平的影响。他们的研究验证了CPP(2005)与尼克福瑞基斯(2008)结论,不过,研究也显示主要是由于反惩罚对合作水平的消极影响强度大于对“二阶搭便车者”的惩罚对合作水平的积极影响,因此,增加二阶惩罚并没有提高群体的合作水平。
(二)内生性惩罚机制
上述分权性、外生性惩罚机制引起了另外两个问题,即在允许惩罚的情况下容易导致“复仇式”的反惩罚,这其中包括反社会性惩罚,而这种反惩罚能够抵消利他惩罚对提升合作水平的积极作用,实验研究的数据表明,反常惩罚或对高合作者的惩罚在所有惩罚行为中占15%到25%;另外一个是由于利他惩罚对双方来说都有成本,因此导致了群体效率降低的问题,比如德雷贝等(Dreber et al.,2008)在哈佛商学院的双人配对的囚徒困境博弈实验,详细分析了个体行为决策与收益之间的关系,他们发现,惩罚行为的采用和收益之间存在很强的负相关,排名越低即收益越高的参与者所采用的惩罚策略要比排名越高即收益越小的参与者少得多,即“赢者不罚”。同时他们的实验再次表明,惩罚会增加合作的频率,但不会增加平均收益水平。
卡萨里等(Casari et al.,2009),埃尔坦等(Ertan,et al.,2009)研究目的在于寻找一个内生性的惩罚规则以更加有效的克服搭便车问题。卡萨里等(2009)在实验中惩罚机制的内生性体现在一致同意实验设置中,该设置规定要对群体中某个成员进行惩罚必须得到两个或以上的群体成员的同意,否则不允许进行惩罚。实验发现:与费尔和盖希特等(2000)的设置相比较,一致同意实验设置显著的提高了群体的合作水平与成员平均收益,而这种改善主要是由于一致同意的惩罚规则减少了群体中对高合作者进行惩罚的行为。在实验设置中,埃尔坦等(2009)根据实验第一阶段对公共账户的贡献水平平均值,把每个群体的成员分为高于、等于与低于平均值的成员,然后要求成员就这三类成员进行投票,最后,根据得票的多少决定谁应该得到惩罚。实验发现,由于采用了投票决定谁应该受到惩罚,没有任何一个小组决定对高合作者进行惩罚,因此,有效的排除了反社会惩罚行为;在合作水平与效率方面,在通过投票决定谁应该受到惩罚的实验设置显著高于没有惩罚以及没有限制惩罚设置;比较不同实验设置群体中的搭便车频率,实验发现,标准VCM中的频率最高,其次是费尔和盖希特等(2000)设置下的搭便车频率,而频率最低的是通过投票限制惩罚行为的设置。
与费尔和盖希特等(2000)的不同,卡萨里等(Kamei et al.,2011,后文中简称为KPT)研究惩罚机制中的惩罚参数的内生性对合作行为的影响。KPT(2011)把24期重复性VCM划分为6个阶段,在每四期实验结束后要求每个群体中5个成员就惩罚参数进行投票,然后根据新的惩罚参数进行新一轮的实验。实验发现:在惩罚实验设置组中,89%的成员投票选择对搭便车者进行惩罚,并且投票者很快就找到最优惩罚系数;与基础实验设置比较,惩罚实验设置组中的合作水平与平均收益显著的提高,并且在重复实验过程中,合作与收益水平得到了有效的维持。
前述内容研究了惩罚技术的内生性对于合作行为的影响,可是,由于他们的研究是在给定惩罚制度的前提下研究惩罚对合作的影响,因此,这些研究不能回答两个理论问题:(1)在公共品博弈中,在存在自主选择的前提下,被试会偏好哪个制度?(2)若群体成员有权进行内生性的选择惩罚制度,这会对他们的合作行为产生什么样的影响?萨特等(Sutter et al.,2010)研究了内生性惩罚制度与合作的关系。
盖希特等(2006)在费尔和盖希特等(2000)实验设计的基础上,允许实验参与者在标准公共品博弈实验设置(SFI)与有成本惩罚机制的公共品实验设置(SI)间进行自由选择,从而研究实施对搭便车者的惩罚机制所具有的竞争优势。在实验的第一期后,比较SI与SFI发现:选择加入SI的参与者仅占全部实验参与者的三分之一;选择SI的参与者平均公共品供给量显著高于选择SFI的参与者,最初选择SI的参与者中有四分之三属于高合作者,选择SFI的参与者中有接近一半的人属于搭便车者;在重复的实验后期,几乎所有的实验参与者选择加入SI并且选择高度合作行为,而SFI中公共品供给几乎等于0。在实验的最后,SI中的成员平均自愿供给公共品达到禀赋的99%,而SFI中成员的自愿供给接近于0。
萨特等(2010)与盖希特等(2006)在实验设计方面存在三个方面的区别:首先,盖希特等(2006)研究被试通过“用脚投票”来实现对制度或机制外生的两个群体的选择,而萨特等(2010)要求被试“用手投票”来内生性的决定群体的制度选择;其次,盖希特等(2006)着重惩罚机制的使用,而前者在研究公共品投资中同时考虑了奖励机制的重要性;最后,后者允许实验参与者在两个不同机制的群体间进行无成本的自由转移,而前者在研究参与者在选择机制时考虑了相应的投票成本。萨特等(2010)研究显示:制度的选择显著的依赖于奖励与惩罚的效率,在高效率的奖惩条件下,85%的群体内生性的选择了带奖励的VCM,而在低效率的奖惩条件下,63%的群体选择了标准VCM;在群体的合作水平方面,制度选择内生时显著高于制度外生;在制度内生选择的实验设置中,无论奖惩效率高低,带奖励的VCM中的合作水平显著高于标准VCM;在低奖惩效率实验设置中,带惩罚的VCM中群体合作水平几乎是带奖励的VCM中合作水平的两倍,不过,在高奖惩效率实验设置中,没有任何一个群体的被试内生选择带惩罚的VCM。
二、领导机制
条件合作者的行为依赖于被试对其他人贡献水平的信念,可是,在同时行动的公共品博弈中,这种来自信念的不确定以及一些被试的悲观信念会造成公共品自愿供给不足。目前,在实验经济学中,学者通过在公共品博弈的贡献决策阶段引入领导机制来解决由于被试的信念而导致的合作问题。在序贯公共品博弈中,追随者往往把自己的贡献决策建立在领导者的合作水平上,另外,在领导者具有信息优势的情况下,追随者往往从领导者的贡献决策中推断信息,这可以诱发出追随者的互惠型或条件合作型行为,从而导致群体合作水平的显著提高(Moxnes和Heijden,2003;Potters et al.2005;Güth et al.,2007;Gächter,et al 2010;Rivas和Sutter,2011)。
(一)外生性领导机制
在公共品博弈实验中,外生性领导机制中的领导一般由实验者指定或者由具有信息优势的一方扮演领导者角色。在领导者与追随者之间存在行为和信息不对称的背景下,研究表明领导者通过榜样或者牺牲自己的利益可以积极的影响追随者的合作行为(Hermalin,1998)。相关的实证研究,最初出现在领导者榜样对慈善筹款的影响机制研究中,韦斯特兰德(Vesterlund,2003)研究了在序贯公共品博弈中领导者慈善捐赠信息对慈善筹款的影响,她认为领导者慈善捐赠榜样在其他捐赠者的行为选择中发挥着框架效应(frame effect),这有利减少公共品供给中的“搭便车”行为。
波特等(Potters et al.,2007)认为理论上在不完全信息的序贯公共品博弈实验中,有可能领导者贡献行为起到了信号传递的功能,从而带动了追随者的贡献行为,并且提高了群体的合作水平,一方面也有可能是因为追随者是互惠型且模仿领导者的行为才引起了上述行为,所以他们设计了一个实验,分别在不完全信息条件下和完全信息条件下,同时实验分别采用序贯博弈方法和同时博弈的方法,这样就有4个实验条件,即不完全信息序贯,不完全信息同时,完全信息序贯和完全信息同时,在不完全信息条件下,他们将MPCR分别设置为(0,0.75,1.5),而完全信息下的MPCR为不完全信息条件下MPCR的期望值。他们在研究中发现:在不完全信息环境中,序贯公共品博弈实验中合作水平比同时博弈高出50%。他们认为这可以由两个方面做出解释:信息优势的领导者以自己的贡献行为作为信号来协调与更新追随者的信念,促使80%的追随者模仿领导者行为;领导者在做贡献决策时已经预期到追随者的条件合作型行为,比如:在MPCR=0.75时,理论上,领导者不应该采用合作行为,但是,实证研究发现,与同时博弈时15%的合作水平相比,序贯博弈时领导者的合作水平提高到了75%,而追随者的合作行为也增加了37%。而在完全信息条件下,序贯公共品博弈和同时公共品博弈之间没有显著的区别,这就证实了领导者贡献行为起到了信号传递的功能,从而带动了追随者的贡献行为,并且提高了群体的合作水平。
可见,领导者的贡献水平影响着群体的合作水平,可是,领导者的贡献水平也不总是高合作型的,有些领导者贡献水平很低,这使得群体的公共品供给水平也很低,而另外一些领导者的贡献水平比较高,使得群体的公共品供给水平也比较高。盖希特等(2010)研究了领导者类型、领导者的贡献决策以及领导者对追随者合作偏好的信念对公共品贡献水平的影响。他们设计一个实验,这个实验是基于一个简单的两人的领导者—追随者博弈实验,具体实验中采用一次实验(one-shot)的版本,参与者在实验中共有7次决策,其中1次是作为领导者,6次是作为追随者,而追随者的决策是通过策略方法(strategy method)引致得出,这样就能根据参与者在追随者情况下的贡献情况确定参与者的类型,同时基于上面的结果,他们让受试者预测他的同伴在追随者情况下的贡献水平,观察不同类型的参与人的信念,以确定是否存在虚假认同效应(false consensus effect)。实验研究发现:领导者的贡献水平与他们的合作偏好之间具有显著相关关系,自私型的领导贡献水平最低,强互惠型领导贡献水平最高,而弱互惠型领导的贡献水平介于两者之间;他们发现对追随者合作类型的期望与领导者合作类型之间具有显著的相关关系,即自私型的领导者总是倾向于认为群体中其他成员更有可能是自私的,而强互惠型的领导者总是倾向于认为群体中其他成员更有可能是强互惠型的。不过,盖希特等(2010)在控制了领导者对追随者合作类型的期望后,实验数据显示不同合作偏好类型的领导者在贡献决策方面依然存在比较大的差异。因此,他们认为不同领导者的贡献水平差异在很大程度上可以由领导者的合作类型差异作出解释,在互惠型领导者的领导下群体的合作水平更高。
(二)内生性领导机制
波特等(2005)研究了在有关公共品价值信息不对称的情景中,内生性领导机制对公共品贡献的作用。内生性主要体现在实验的博弈顺序结构(序贯还是同时)由被试投票与一致通过规则决定。他们设计了一个实验,在实验中组内共有两个参与者,同时MPCR是不确定的,在内生性实验设置中,共有两个阶段,第一阶段是投票阶段,在这阶段参与者1和2都投票a1和a2(a1,a2=0或1),只有当A=a1*a2=1时,则采用序贯博弈,参与者1的贡献率要被第一个被公布,第二阶段是贡献阶段,如果投票决定采用序贯博弈,那么MPCR对于参与者1就是已知的,而对于参与者2仍然是不确定的。为了对比外生性和内生性的差异,他们同时也设置两个外生性实验,分别是外生性序贯博弈和外生性同时博弈。在内生性博弈中,从理论上可以看出存在两个贝叶斯博弈均衡,其中序贯博弈是帕累托最优的。而在研究中发现,在内生性实验设置中,具有私人信息的被试中有82%投票赞成采用序贯博弈顺序,而没有私人信息的实验者中有99%赞成,结果有81%的实验小组采用了序贯博弈顺序;研究还发现无论博弈顺序是内生的还是外生给定的,在序贯博弈实验中的领导者与追随者的贡献水平与个人收益水平都显著高于采用同时博弈顺序时的水平。不过,内生性的序贯博弈顺序时的公共品供给水平与实验者收益水平比在外生性的序贯博弈实验时的高。
古斯等(Guth et al.,2007)在关于领导机制对于公共品博弈实验中合作行为影响的研究中,试图解答三个方面的问题:(1)领导者榜样作用对于VCM中的贡献率以及领导者的权力对于领导者榜样作用在VCM中的影响是怎样的;(2)如果领导者是固定或者轮流,对于其在VCM中贡献率是否有影响;(3)如果领导者是内生产生的,又会是什么情况。所以他们在实验设置时,在领导者榜样的基础上赋予领导者具有开除群体成员的惩罚权力,外生领导机制由实验者指定一个人为领导或者群体内部成员轮流做领导,而内生领导机制通过群体投票决定本群体是否需要一个领导。具体实验设计中,他们采用了三种类型的VCM:(1)标准VCM,(2)带有领导者的VCM,(3)带有强领导者的VCM。在分析第一个问题时候,他们采用带有强领导者的VCM,赋予领导者具有开除群体成员的惩罚权力。在分析第二个问题时候,他们采用带有领导者的VCM,同时设置了两个部分,第一部分中,领导者是固定的,在第二部分中,领导者是轮流担任。而对于第三个问题的分析,他们采用了带有领导者的VCM,只是领导者是投票内生产生的。研究发现,领导者的榜样对于公共品的供给具有积极的影响,并且在领导者具有开除群体成员的惩罚权力时,群体内部公共品供给水平显著的提高;在两种外生的领导任命方式的实验中,公共品的供给水平没有显著的差异;实验发现40%的群体通过投票成功的产生了领导,在公共品供给水平方面,有领导的群体显著的高于没有领导的群体。
在现实中,一些群体中的领导既不是外生指定,也不是通过投票内生决定的,而是群体成员自愿充当领导角色的。里瓦斯和萨特(Rivas and Sutter,2011)研究自愿领导对公共品博弈的影响。在自愿领导实验设置中,在每期公共品博弈贡献阶段开始前允许小组中四个成员中的任意一位自愿决定是否担任领导的角色,一旦产生了自愿领导者,他就开始作出公共品贡献决策并且向其他三位成员公开决策信息,然后,其他成员同时就贡献水平作出决策,若博弈开始前没有人自愿做领导,那么该实验过程就等同于标准VCM。研究发现,自愿领导设置中的合作水平比标准VCM高50%,比外生领导实验设置高80%。另外,他们发现自愿领导不仅提高了群体的合作水平,而且也降低了领导者与追随者在合作水平之间的差异。与外生领导实验设置相比较,自愿实验设置中的自愿领导机制发挥着信号功能,从而自愿领导对于追随者的榜样作用更强。
三、群分机制
(一)外生性群分机制
由于被试的异质性,那么形成PG(Public Goods)博弈实验小组的成员组成将对参与者的合作行为产生怎样的影响?冈恩托斯道特等(Gunnthorsdottir et al.,2007a,b)与盖希特和托尼(2005)的研究根据参与者过去的贡献水平进行群分。冈恩托斯道特等(2007a)在实验中采用了两种实验设置:随机设置与分类设置。在分类实验设置中,实验工作者根据12名参与者在初始实验中的贡献量把他们分为高、中、低档三个小组。实验发现:对于给定的MPCR,分类设置中具有高合作倾向的一组中平均贡献量显著高于随机设置,并且随重复次数而下降的趋势更加缓慢;在MPCR=0.5或者0.75时,分类设置中群体的合作水平可以得到有效维持,甚至不出现合作水平衰减的趋势。盖希特和托尼(2005)采用一次性线性PG博弈(MPCR=0.6)来进行“排名”实验,目的是测量实验参与者的类型(合作态度)。完成“排名”实验后,他们开始进行10期固定成员的分类PG博弈。在实验前,参与者被告知群体分类的规则:根据在“排名”实验中成员的贡献水平由高到低,三人一个小组。小组分类完成后,成员获取有关本小组中其他成员贡献水平的信息。盖希特和托尼(2005)研究表明,外生性分类群体有效的提高与维持了群体的合作水平,而这种合作水平的提高是通过在合作倾向方面具有异质性的成员之间进行社会学习而实现的。
不过,这种外生性群分机制在实验设计上还存在着一些问题。比如:在对成员进行“排名”或分类而进行的第一期实验中,没有办法排除参与者基于对其他成员合作的信念而采用的策略性行为,这造成在盖希特和托尼(2005)的研究中得出了一个不符合逻辑的结论:当把“排名”实验中合作倾向最低的成员组合在一起时,该小组的合作水平却高于随机组中、低合作水平的小组。另外,在他们的实验设计中没有办法有效的检测出参与者所具有的群体成员信息对参与者合作行为的影响。戴·奥利维拉等(De Oleveira et al.,2009)根据菲施巴赫尔等(Fischbacher et al.,2001,后文中简称为FGF)测量出的成员社会偏好类型进行归类,把被试分为条件合作者与自私者两类,然后根据被试的类型群分为同质组与异质组,并且在实验设置中根据被试是否具有群体其他成员类型的信息把群体分为:知道信息分布组与不知信息分布组。他们的研究发现:由条件合作者组成的群体在合作水平上显著高于异质组;另外,知道信息分布组的合作水平也明显高于不知信息分布组,这意味着参与者所拥有的群体成员类型信息对参与者合作行为具有重要影响。
(二)内生性群分机制
对PG博弈中群体内生性的研究开始于埃尔哈特和克泽尔(Ehrhart and Keser,1999),他们把9个被试随机的分为三个小组,允许实验参与者单方面的自由决定加入其他群体或组建新的群体。由于群体中的合作者没有办法排除搭便车者的加入,因此,群体的合作水平很难维持并且呈下降趋势。在现实中,有关拥有决定谁应该进入或谁应该被排除出群体的权力对于群体的合作水平具有重要的影响,辛尼瓦古马等(Cinyabuguma et al.,2005)在标准的PG博弈实验基础上允许群体成员通过投票,并且可以按照多数票规则决定谁将被驱除出群体。他们的研究发现,与标准PG博弈实验相比,一旦引入驱除机制,群体成员的合作水平得到显著提高,并且得到了有效的维持。不过,他们在实验中规定:某个群体成员一旦被驱除出现在的大群体就没有机会重新回来,而是只能进入另一个低收益的群体进行博弈。我们认为这种驱除机制过于严厉,这会造成群体规模的不断缩小,进而使得群体所能够提供的PG水平不断下降。查尔斯和扬(Gary Charness and Young,2010)认为辛尼瓦古马等(2005)的驱除机制并不现实,并且没有考虑群体成员自愿离开群体的行为。他们主要研究群体成员退出、驱除以及群体规模内生化对群体成员合作行为的影响。在实验中规定每三期实验结束后,群体成员可以自主决定是否离开原来的群体(Ehrhart 和 Keser,1999),同时,群体成员还就留下来的成员进行投票表决,采用多数投票规则决定具体哪个成员应该被驱除出群体(Cinyabuguma,Page和Putterman,2005),不过,被驱除出去的成员有权力自主决定是否加入其他群体。实验还规定不同群体可以通过投票决定是否应该合并成更大的群体。实验研究发现:内生性群体实验组的PG贡献水平明显高于固定群体成员控制组,在群体合作水平的维持方面,固定群体成员控制组的合作水平呈现出持续的下降趋势,最后实验期仅有25%的合作水平,而内生性群体实验组的合作水平比较稳定,在最后的实验期还保持95%的合作水平。
布雷克等(Brekke et al.,2011)规定所有实验被试都要参加由三个部分组成的31期PG博弈实验。实验的第一部分是一次性标准PG博弈实验;第二部分是10期固定群体成员的重复PG实验,不过,在开始重复博弈前被试必须就加入蓝组还是红组进行决策,如果被试决定加入蓝组,那么他将获得50挪威克朗,如果被试决定加入红组,那么他将向挪威红十字会捐赠50挪威克朗,当被试做出该决策后,分别将选择红组与蓝组的成员按照三人一小组进行分组,然后开始重复PG实验;第三部分是20期PG博弈实验,与第二部分的区别在于:每期实验前,被试可以重新选择加入红组或者蓝组,每期实验的成员分别从红组或蓝组中随机产生,并且都获取前一期实验中红组与蓝组中每个小组的平均贡献水平。研究发现:在一次性PG博弈实验中合作水平高的实验者在后续的实验中更多的选择了红组;在任一实验期,红组中成员平均合作水平显著的高于蓝组,并且实验后期的合作水平红组得到了有效维持,而蓝组不断下降;对于具体的某个被试,当他作为红组成员时的合作水平往往会高于做为蓝组成员时的合作水平;随着实验的不断进行,红组与蓝组的合作水平差距不断变大。
四、结语
研究如何提高公共品博弈中的合作水平,对于解决提高团队竞争力、增加公共品的供给(比如:慈善捐赠)、解决环境保护以及气候变暖问题,甚至对于构建和谐社会等都具有重要的意义。现有文献围绕着公共品博弈中合作行为的两个问题(为什么出现合作行为?如何维持与提高合作水平),从被试合作行为的异质性角度解释了为什么在重复公共品博弈时合作水平会下降,然后分别从惩罚机制、领导机制两个方面综述了有关提高与维持合作水平的文献。对于每个提高合作水平的机制,我们都从外生与内生两个方面进行梳理和展开分析:惩罚机制主要研究在标准VCM基础上增加具有成本的惩罚阶段,现有的研究主要通过外生或内生的方法选择不同的惩罚技术或制度以实现增加一阶或二阶“搭便车”者的成本以提高合作水平;领导机制把标准VCM的同时博弈改为序贯博弈,通过对被试合作水平信念的影响,激发追随者的条件合作行为,从而提高合作水平。由此在一定程度上看出:可控实验方法在研究经济行为时的科学合理性及有效性。