交互博弈中的噪音与信息整合
上QQ阅读APP看书,第一时间看更新

三 模型与验证性偏差的建立

(一)基本模型

本章基本模型的设置几乎与Kartik等(2014)所建模型一致。其一,模型中假设行为决策人(decision maker,以下简称DM)即信息接收者(或接收方)无法直接获取信息。因此接收方所做的关于最终行为a∈[0, 1] 的决策必须取决于信息发送者(或发送方)(Si, i=1,2)的建议,发送方的建议将以包含相关信息的消息(message)形式传递给DM。模型中所谓信息是关于某一事件或事物状态的描述,表示为ω∈{0, 1},服从二元分布。Si通过投资获得包含所求信息的信号,并据此为DM发送相应的消息,而DM基于所得消息将自己对ω=1的概率的信念(belief)进行相应的更新,并根据更新后的最终信念做出行为决策。DM需要做出最佳行为决策以实现自身得益-(a-ω)2 最大化。从DM的得益函数可看出,DM越能准确把握ω的真实状态,DM所得到的收益就越高。如前所述,所有交互博弈参与方(S1, S2, DM)的初始信念都是客观的,即交互博弈开始时,他们都认为ω是0和1的概率各为。这样的假设可以确保所有参与方在信息交流开始前都不存在验证性偏差。DM的信息后信念(或最终信念),表示为P,DM接收两个消息后最终形成。同样地,P也代表DM所认为的ω=1的概率。事实上,PDM关于ω真实状态的期望。所以,为了实现效用最大化,DM会选择行为a=P

其二,作为交互博弈的另一方,模型中存在两个信息发送方(Sii=1, 2),他们可以选择发送的消息有三种,表示为mi∈{G, N, B},i=1, 2。具体来说,Si通过发送消息GDM来暗示ω=1;通过发送消息BDM来暗示ω=0;通过发送消息NDM表示他没有获得任何有用的信息。Si对信息所做的采集和整合努力用他自主选择的信息整合投资水平(xi)来表示。Si的投资行为会产生相应的投资成本,记作Ci (xi)。当Si选择投资时,他能观察到关于ω信息的有用信号的概率为xi。也就是说,尽管他进行了投资,仍存在1-xi的概率使他无法获得任何有效信号。这也是出现用NDM表示无信号情况的原因。Si通过投资所获得的关于ω信息的信号表示为Si∈{g, n, b}。同样地,g代表一个标示着ω=1的“好”的信号,而b代表一个标示着ω=0的“坏”的信号。为保持叙述的一致性,Si 没能获得任何信号时,我们也将这种情况以信号表示,即信号n。需要注意的是,模型中的信号并不一定反映ω的真实值。具体地说,信号产生过程存在不准确性。信号产生的准确率由准确因子表示:

由此假设,我们可确保本章模型中的信号都具有既包含一定信息又无法准确揭露信息真实状态的特征。获得信号后,Si根据自身需要决定他想发送给DM的消息。为了尽可能地提高研究分析的完整性,在之后的讨论中,本章的模型将主要分为两种类型。在一种模型中,Si可以无成本发送虚假消息,而在另一种模型中,我们假设欺骗行为会产生一个外生给定的欺骗成本(cheating cost)θi。此外,作为说服交互博弈(persuasion game), Si的欺骗行为受到一定约束,即他所能做的选择只有两种,一是通过正确的消息将自己所获得的信号信息传达给DM,二是通过发送消息NDM表示没有信息可传达,即隐藏自己所获得的信号。也就是说,当消息可被验证时,Si无法欺骗DM假装自己得到了一个实际上并未获得的信号。在以上假设下,Si的行为有以下几种模式。其一,当他们所获得的恰好是他们所偏好(能提高自己的得益)的信号时,Si诚实地将其相对应的消息传递给DM。其二,当他们获得的是他们所厌恶(将降低自己的得益)的信号时,Si发送消息NDM假装自己没有获得任何信号(在没有欺骗成本的模型中,欺骗无代价;在有欺骗成本的模型中,欺骗成本为θi)。其三,尽管获得的是自己所厌恶的信号,他们还是诚实地传递相应的消息。其四,没有获得任何信号,并将此诚实地通过消息N传递给DM

如前文所假设,本章的模型既不是单纯的同时交互博弈模型,也不是顺序交互博弈模型。因此,在展开模型的分析前,我们有必要对消息的传递顺序进行说明。在接下来的讨论中,我们假设S1的消息将先被DM读取(进一步分析可以证明,任何一个发送方的消息先被读取所得到的结果都是一致的)。同时,在不丧失一般性的条件下,我们还可以假设S1是偏好正向状态(ω=1)的。基于这些假设,我们可以进一步总结出S1的所有行为模式:当观察到信号g时,发送消息G;当观察到信号n(无信号)时,发送消息N;当观察到信号b时,S1的行为取决于他在不同决策下所能获得的收益。因为信号b不是S1所偏好的信号,他会通过隐藏自己获得的信号并发送消息N来提高自己的得益。在含欺骗成本情况下,若模型中有欺骗成本但欺骗成本不足以抵消S1隐瞒信息所带来的得益增加时,S1会选择以成本θ1为代价发送消息N;反之,则发送消息B。当欺骗成本刚好等于欺骗行为所带来的得益增加时,S1则随机选择欺骗或者不欺骗,即S1在消息发送行为上选择混合策略。而在无欺骗成本的模型中,S1隐瞒信息所获得的得益必定高于他如实发送消息所能获得的得益,因此他会始终选择发送消息 N 以提高得益。在所有的模型中,Si的投资水平xiSi通过信息整合投资所获得的信号都无法被除Si 以外的其他所有参与方直接观察得知。因此所有博弈方在对其他参与者的行为和得益做预测时,都需要用推测值代替真实投资水平xi。根据博弈的相关理论,当所有博弈方的策略组合达到均衡时,每个博弈方对其他参与者的最佳反应函数下的行为正好是其他参与者对这个博弈方的推测策略。简言之,根据均衡下的信念一致性我们可以得出,均衡时,推测值和真实值必然相等:

本章中,Si的偏好同样是由他们的得益函数所决定的。不同偏好的发送方所对应的得益函数也不同。具体而言,如果Si偏好正向的状态,则他的得益函数可以表示为a-Ci(xi),即DM所做出的行为决策a越大越好。如果Si偏好负向的状态,则他的得益函数可以表示为1-a-Ci(xi),即a越小越好。在下文的讨论中,我们将从S1偏好正向、S2偏好负向的假设出发展开分析。事实上,通过附录的证明可以发现,两位信息发送者的偏好是否相同、是否为正或为负都不影响本章结果的一致性。

(二)验证性偏差的量化

从前文的描述中我们已经了解,验证性偏差的量化是一项较为复杂的工作,更为不利的是,当前并没有较多可靠的文献研究可以为此提供参考。本章借鉴Rabin和Schrag(1999)的研究,对其进行进一步完善和扩展,开创性地建立了比较简单可行的验证性偏差量化模型。之后的分析研究主要通过两种不同的量化方法来实现验证性偏差在交互博弈中的量化。

验证性偏差的量化方法一:方法一描绘的是验证性偏差的其中一种表现形式,即一个错读消息的大于零的概率。在本章的模型中,这一概率将以两种不同的形式表示。本章从外生给定的错读概率开始展开分析,讨论固定的错读概率下验证性偏差在模型中的影响,继而进一步分析当错读概率从一个固定值变为一个受验证性偏差影响的函数时,验证性偏差的影响效果。稍后的讨论会证明,不论是既定变量还是函数,它们都不会导致方法一中的验证性偏差对交互博弈的影响发生质的改变。根据方法一的具体设定,只要DM的中间信念因为偏离客观信念而产生验证性偏差,DM在面对一个不支持或否定其原有信念的消息时就会以一个正的概率做出错读行为。换言之,只要DM产生验证性偏差,并且接收到一个不支持其中间信念的新消息,错读事件就有可能发生。举例来说,如果DM接收到的来自第一个发送方的消息使他据该消息所形成的中间信念向下偏离客观信念,这就意味着DM不再保持客观态度而是相信ω=0更有可能发生。根据方法一,带有这种向下偏离验证性偏差的DM会以一定概率将之后收到的来自第二个发送方的消息G或消息N错读成消息B;反之,如果DM接收到的第一个消息使他的中间信念向上偏离客观信念,那么他会认为ω=1更有可能,从而以一定概率将接下来收到的消息BN错读成消息G。方法一很好地模拟了带有验证性偏差的交互博弈参与人错读随后消息的行为,与之前所提到的心理实验结果十分接近。

方法一很好地模拟了验证性偏差给当事人所带来的错读效果。但是在本章模型中,因为消息和信号都是离散形式的,当带有向上偏离验证性偏差的DM遇到随之而来的正向消息G或带有向上偏离验证性偏差的DM遇到随之而来的负向消息B时,采用方法一进行量化的过程中就会产生带有验证性偏差的DM按照纯理性模式进行消息处理的情况。这意味着方法一在离散消息模型的部分情形中将无法适用。因此,为了更好地刻画验证性偏差在双信息传递说服博弈模型中的影响,本章对方法一进行了进一步的拓展和完善,最终建立了方法二。根据验证性偏差的概念及表现形式可以发现,当DM遇到一个支持或有利于自身当前信念的消息时,他应该会表现得过度自信从而使更新的信念偏离一个客观行为人面对同样消息时理应达到的水平。具体来说,如果DM收到的第二个消息是G而他的中间信念已经让他更倾向于相信ω=1,或DM收到的第二个消息是B而他的中间信念已经让他更倾向于相信ω=0时,带有验证性偏差的最终信念会比DM在理性情况下形成的最终信念更加偏向极端化。我们用偏见性误差τ来衡量DM在理性状态下和在验证性偏差下判断ω=1的两个概率之间的差异。具体而言,在上述第一种情形下,验证性偏差下DM的最终信念是他在理性状态下接收到同一消息后所形成的最终信念再加上偏见性误差τ所带来的对ω=1概率推测的额外偏移;反之在第二种情形下,则将此过程改为减去 τ。如此,完整的量化方法二可以表述如下。首先,如果DM的中间信念大于并且他接收到的第二个消息为G,则他的最终信念为理性最终信念加上由于验证性偏差而产生的偏见性误差τ。其次,如果DM的中间信念大于并且他接收到的第二个消息是NB,或者DM的中间信念小于并且他接收到的第二个消息是NG,则他将按照方法一描述的步骤更新信念。最后,如果DM的中间信念小于并且他接收到的第二个消息是B,则他的最终信念为理性最终信念减去由于验证性偏差而产生的偏见性误差τ。方法二中的衡量方法包含了验证性偏差在所有不同情形下可能出现的表现形式。关于方法二的进一步讨论将在稍后的模型分析中进行。

除了以上描述中所涉及的相关变量及参数的表示符号外,本章关于所有交互博弈参与方信念的表示方式与Kartik等(2014)研究中的表示方式一致。例如,代表DM根据从S1处所获得的消息m1而形成的中间信念。表示 DM 根据从S1S2 处所获得的两个消息而形成的最终信念。SiDM 最终信念的期望则用来表示:

其中,ij∈{1, 2}。在所有的等式中,ti代表Si发送虚假信息N的概率。

本章所研究的交互博弈的整个过程描述如下:S1S2同时决定他们的投资水平x1x2以获取能够提示真实状态的信号s1s2。获得信号后,S1S2根据他们各自对对方的策略推测和自己所获得的信号分别决定自己想要发送给DM的消息。DM在接收到消息后最终形成一个受到验证性偏差干扰的最终信念并选择行为a。博弈完成时所有参与者获得各自的得益且达到完美贝叶斯均衡。