第四节 博弈论
博弈论是研究在策略性环境中如何进行策略性决策和采取策略性行动的科学。在策略性环境中,每一个人进行的决策和采取的行动都会对其他人产生影响。因此,每个人在进行策略性决策和采取策略性行动时,要根据其他人的可能反应来决定自己的决策和行动。
一、条件策略和条件策略组合
在同时博弈中,在给定其他参与人的策略时,某个参与人的最优策略称之为该参与人的条件优势策略(简称条件策略),而包括该参与人的条件策略以及这些条件在内的所有参与人的策略组合称之为该参与人的条件优势策略组合(简称条件策略组合)。
二、纳什均衡
所谓纳什均衡,指的是参与人的这样一种策略组合,在该策略组合上,任何参与人单独改变策略都不会得到好处。即如果在一个策略组合中,当所有其他人都不改变策略时,没有人会改变自己的策略,则该策略组合就是一个纳什均衡。
三、占优策略均衡
占优策略均衡指这样一种均衡,不管其对手采取什么策略,该竞争者采取的策略都是最优策略。占优均衡是一种纳什均衡。占优均衡若存在,只存在惟一均衡,而纳什均衡可能存在多重解。
四、囚徒困境
囚徒困境的博弈模型的假设条件是:甲、乙两个被怀疑为合谋偷窃的嫌疑犯被警方抓获,但警方对他们偷窃的证据并不充分。他们每一个人都被单独囚禁,并单独进行审讯,即双方无法互通信息。警方向这两个嫌疑犯交待的量刑原则是:如果一方坦白,另一方不坦白,则坦白者从宽处理,判刑1年;不坦白者从重处理,判刑7年。如果两人都坦白,则每人都各判刑5年。如果两个都不坦白,则警方由于证据不足,只能对每个人各判刑2年。表2-5的支付矩阵描述了这一博弈。表中的报酬均为负数,以表示判刑的年数。
表2-5 囚徒困境
通过分析可以看出,囚徒困境的博弈有一个占有策略均衡(坦白、坦白)。但是,如果两人都是选择不坦白(即合作),则都可以获得最好的结局。很清楚,囚徒困境的占有策略均衡反映了一个矛盾:即个人理性和团体理性的冲突。