上QQ阅读APP看本书，新人免费读10天

设备和账号都新为新人

第11章博弈(1)

博弈是什么呢？

《现代汉语词典》中对“博弈”一词的解释为：1.古代指下围棋，也指赌博。2.比喻为谋取利益而竞争。

这些解释与2005年因博弈论而获得诺贝尔经济学奖的罗伯特?奥曼教授所说的“所谓博弈，就是策略性的互动决策”这一概念有相通之处。无论是下围棋、赌博还是为谋取利益而进行竞争，其实质都是在做策略性的互动决策，即你作为一个“理性人”的情况下，为了达到自己的目标和利益，在考虑做何决策时，一定要考虑对手的各种可能的行动方案。比如日常生活中的下棋，打牌等。在你出子、出牌之前，一定会考虑对手将如何应对，并力图选取对自己最为有利或最为合理的方案。博弈论就是研究博弈行为中斗争各方是否存在着最合理的行为方案，以及如何找到这个合理的行为方案的数学理论和方法。

如果你是一个很理性的人，在你做策略选择时，你必须考虑到在同一“局”中的其他人会如何选择，因为这关乎你的成败甚至生死。这就是博弈。

博弈论教人斗心眼儿？

在英文中，“博弈”一词为“Game”，“ Game”是人们遵循公平规则下的活动，每个人在活动中的目的都是使自己获胜，它同时有“竞赛”的意思，比如奥林匹克运动会在英文中就是“Olympic Game”。“Game”一般被翻译成汉语中的“游戏”，但“游戏”一词更多地带有消遣或娱乐的性质，多数情况下参与者并不认真，甚至带有“儿戏”的味道。所以在这里我们把英文中的“Game”译为“博弈”而非游戏，把“Game theory”译为“博弈论”而非“游戏理论”。

博弈论（Game Theory），就是二人在平等的对局中各自利用对方的策略变换自己的对抗策略，达到取胜的意义。有时也称为赛局理论，是研究具有斗争或竞争性质现象的理论和方法，它是应用数学的一个分支，既是现代数学的一个新分支，也是运筹学的一个重要学科。简单说来，博弈论就是研究人们如何进行决策、以及这种决策如何达到均衡的科学。每个博弈者在决定采取何种行动时，不但要根据自身的利益和目的行事，还必须考虑到他的决策行为可能对其他人造成的影响，以及其他人的反应行为可能带来的后果，通过选择最佳行动计划，来寻求收益或效用的最大化。对博弈论通俗的理解就是：它是关于人与人“斗心眼儿”的学问，如何在斗争中让自己更加“老谋深算”、从而立于不败之地的学问。

博弈论有几个构成要素？

从狭义上讲，博弈是以利益为目的，有利可图是形成博弈的基础，所以博弈包含的要素有以下四点：

1.参与人数至少是俩人；

2.博弈双方或多方要有相互竞争的利益中心；

3.参与者有自己的竞争策略；

4.参与者拥有相关博弈必备的知识和信息。

什么是局中人？

局中人是指参加博弈的直接当事人，即以自身效用最大化为准则的理性决策主体。在一场竞赛或博弈中，每一个有决策权的参与者成为一个局中人。只有两个局中人的博弈现象称为“两人博弈”，而多于两个局中人的博弈称为 “多人博弈”。

比如，在一场竞争（简称一局对策）中总有这样的参与者，他们为达到各自的目的、争取得到对自己有利的结局，必须制定对付竞争对手们的行动方案，这种有决策权的参与者被称为局中人。而那些在一局对策中既不决策且结局又与他的得失无关的人（如棋赛的裁判员）就不算局中人。

什么是博弈均衡？

均衡是平衡的意思，在经济学中，均衡意即相关量处于稳定值。在供求关系中，某一商品市场如果在某一价格下，想以此价格买此商品的人均能买到，而想卖的人均能卖出，此时我们就说，该商品的供求达到了均衡。

博弈均衡是指使博弈各方实现各自认为的最大效用，即实现各方对博弈结果的满意，使各方实际得到的效用和满意程度是不同的。在博弈均衡中，所有参与者都不想改变自己的策略的这样一种相对静止的状态。

博弈各方的关系不仅体现一种利益上的竞争，更要体现出各方的合作关系。比如，企业间通过收购、兼并等方法进行资产重组，以实现其双赢战略，正是博弈均衡的现实体现。博弈实质上是由动态的竞争（讨价还价）到相对静态的合作“博弈均衡”的一个变动过程，所以博弈均衡不仅是市场竞争的需要，也是企业发展的内在要求。

为何均衡前冠纳什之名？

纳什均衡是这样的一种博弈状态：对博弈参与人来说，给定对手选定的一个策略，则我选择的某个策略一定比选其他的策略好。即各方的行动就是针对对方行动而确定的最佳对策。一旦知道对方在做什么，就没人愿意改变自己的做法。博弈论学者把这么一个结果称为“均衡”。这个概念是由普林斯顿大学数学家约翰·纳什提出的，因此被称为“纳什均衡”。

对于多人参与、非零和的博弈问题，在纳什之前，无人知道如何求解，或者说怎样找到类似于最小最大解那样的“平衡”。而找不到解，下面的研究当然无法进行，更谈不上指导实践了。纳什对博弈论的巨大贡献，正在於他天才性地提出了“纳什均衡”的基本概念，为更加普遍广泛的博弈问题找到了解答。

纳什的好友，普林斯顿大学经济学教授迪克西特曾说，“如果每次有人说起或写下纳什均衡这几个字，纳什都能拿到一块钱的话，那么他现在会是个大富翁了！”

什么是纳什均衡呢？

简单说就是，一策略组合中，所有的参与者面临这样的一种情况：当其他人不改变策略时，他此时的策略是最好的。也就是说，此时如果他改变策略，他的支付将会降低。在纳什均衡点上，每一个理性的参与者都不会有单独改变策略的冲动。

在囚徒困境中存在惟一的纳什均衡点，即两个囚犯均选择“招认”，这是惟一稳定的结果。

有些博弈的纳什均衡点不止一个，其最后结果难以预测。纳什均衡给我们的一个启示就是现实生活中经常存在这样一种情况：当你的利益与他人的利益发生冲突时，你要学会设法对其进行协调。如果现实不允许你最大限度地满足自己的利益，那么退而求次，总比让双方什么都得不到要强得多。而且你在这次博弈中所失的，可能会在下次博弈中获得补偿。

需要强调的是：均衡不一定是博弈的最优结果。在“囚徒困境”中，惟一的均衡是一起招认，站在群体的角度，这是最坏的结果。均衡只是博弈的最“稳定”结果，或者说是最可能出现的结果。

什么是“颤抖手精炼均衡”？

“颤抖手精炼均衡”概念是泽尔腾提出的对纳什均衡的一个改进。颤抖手精炼均衡的基本思想是:在任何一个博弈中，每个局中人都有一定的犯错误的可能性（类似一个人用手抓东西时，手一颤抖，他就抓不住他想抓的东西）。一个策略对是一个颤抖手精炼均衡时，它必须具有如下性质:各局中人要采用的策略，不仅在其他局中人不犯错误时是最优的，而且在其他局中人偶尔犯错误（概率很小，但大于0）时还是最优的。可以看出，颤抖手精炼均衡是一种较稳定的均衡。

从博弈论中我们知道，泽尔腾的这种“颤抖手均衡”也是一种精炼纳什均衡。大致说来，泽尔腾（1975）假定，在博弈中存在一种数值极小但又不为0的概率，即在每个博弈者选择对他来说所有可行的一项策略时，可能会偶尔出错，这就是所谓的“颤抖之手”。因之，一个博弈者的均衡策略是在考虑到其对手可能“颤抖”（偶尔出错）的情况下对其对手策略选择所作的最好的策略回应。单从这一点来看，在演进博弈论中，最初的演进稳定性的出现，并不完全来自博弈双方的理性计算，而实际上可能是随机形成的（往往取决于博弈双方“察言观色”的一念之差）。按照这一分析思路，我们也可以认为，人们对一种习俗（演进稳定性）的偏离，也可能出自泽尔腾所说的那种人们社会博弈中的“颤抖”。

什么是主观概率？

概率依其计算方法不同，可分为古典概率、试验概率和主观概率。

主观概率以概率估计人的个人信念为基础。主观概率可以定义为根据确凿有效的证据对个别事件设计的概率。这里所说的证据，可以是事件过去的相对频率的形式，也可以是根据丰富的经验进行的推测。比如有人说:“阴云密布，可能要下一场大雨!”这就是关于下雨的可能性的主观概率。主观概率具有最大的灵活性，决策者可以根据任何有效的证据并结合自己对情况的感觉对概率进行调整。

在实践中，有些随机事件既不能按古典概率，也不能按试验概率计算各种可能发生结果的概率，而只能依据主观判断确定各种可能发生结果的概率。特别是在充满不确定因素的经济问题中，不存在大量重复性过程，决策者而对的往往是仅发生了一次的事件或在相同条件下重复发生的事件，因而，需要运用主观概率[1]。

主观概率是人们对某一事件A发生信任程度大小的主观评价，即：

P（A）=[对A发生的信用度]

主观概率也必须符合概率论的基本定理：所确定的概率必须大于或等于0，而小于或等于1；经验判断所需全部事件中各个事件概率之和必须等于1。

你知道那头可笑的布利丹驴吗？

布利丹效应是从一个外国成语引申而来的。14世纪，法国经院哲学家布利丹，在一次议论自由问题时讲了这样一个寓言故事：“一头饥饿至极的毛驴站在两捆完全相同的草料中间，可是它却始终犹豫不决，不知道应该先吃哪一捆才好，结果活活被饿死了。”由这个寓言故事形成的成语“布利丹驴”，被人们用来喻指那些优柔寡断的人。后来，人们常把决策中犹豫不决、难作决定的现象称为“布利丹效应”，又称布里丹之驴、布里丹选择或布里丹困境。

何谓无名氏定理？

无名氏定理即在重复博弈中，只要博弈人具有足够的耐心（贴现因子足够大），那么在满足博弈人个人理性约束的前提下，博弈人之间就总有多种可能达成合作均衡。存在无穷多对有限自动机策略，可以成为无限重复博弈的平衡点，并同时实现双方的合作。无名氏定理之所以得名，是由于重复博弈促进合作的思想，早就有很多人提出，以致无法追溯到其原创者，于是以“无名氏”命名之。

什么是变和博弈？

变和博弈也称非常和博弈，则是指随着博弈参与者选择的策略不同，各方的得益总和也不同。参与者之间的利益既对立又统一，既竞争又合作，各自收益之和是一个变数。如足球联赛中胜方积3分，平局各积1分，每场双方积分之和，或者3分，或者2分。又如在同一个股票市场，面对同样的大盘走势，伴随着投资者的投资策略不同，有可能大部分人赚钱而小部分人亏钱，也有可能小部分人赚而大部分人亏，甚至还有可能所有人都赚或都亏。

变和博弈需要两个先决条件：一个是双方能够共谋，另一个是双方能建立彼此信任的机制。如果两个囚徒彼此不能信任，虽然共谋，其结果还是零和博弈，即双方都选择招供。

何谓常和博弈和零和博弈？

变和博弈是最一般的博弈类型，而常和博弈和零和博弈则是它的特例。

常和博弈是指所有博弈方的得益总和等于非零的常数，参与者的利益根本对立，各自收益之和是一个常数。如若干人分配一份总额既定的财产乃典型的常和博弈。又如排球、乒乓球等体育比赛的每个回合，双方得分之和恒为1。常和博弈的特例是零和博弈，指参与者的利益完全对立，各自收益之和恒为零。如各种方式的赌博、特定指数的炒股，都是一方所得即为他方所失，胜方赢多少，败方输多少。

围魏救赵是博弈策略吗？

什么是博弈策略呢？它是指每个博弈方在进行决策时可以选择的方法、做法等。

可以说在我国传统文化中，包含有许多精妙的博弈策略。许多成语及成语典故，就是对博弈策略的令人叫绝的运用和归纳。如围魏救赵、背水一战、暗渡陈仓、釜底抽薪、狡兔三窟、先发制人、借鸡生蛋等等。当然，博弈策略的成功运用须依赖一定的环境、条件，在一定的博弈框架中进行。关于博弈策略的类型，有纯策略和混合策略之分：

1、纯策略是指参与人在博弈中可以选择采用的行动方案。

2、混合策略是在纯策略空间上的一种概率分布，表示参与人实际进行决策时根据这种概率分布在纯策略中随机选择加以实施。

何谓重复博弈？

顾名思义，重复博弈是指同样结构的博弈重复许多次。它是一种特殊的博弈，在博弈中，相同结构的博弈重复多次，甚至无限次。其中，每次博弈称为“阶段博弈”。在每个阶段博弈中，参与人可能同时行动，也可能不同时行动。因为其他参与人过去的行动的历史是可以观测的，因此在重复博弈中，每个参与人可以使自己在每个阶段选择的策略依赖于其他参与人过去的行为。

在重复博弈中，每次博弈的条件、规则和内容都是相同的，但由于有一个长期利益的存在，因此各博弈方在当前阶段的博弈中要考虑到不能引起其它博弈方在后面阶段的对抗、报复或恶性竞争，即不能象在一次性静态博弈中那样毫不顾及其它博弈方的利益。当博弈只进行一次时，每个参与人都只关心一次性的支付；如果博弈是重复多次的，参与人可能会为了长远利益而牺牲眼前的利益，从而选择不同的均衡策略。有时，一方做出一种合作的姿态，可能使其它博弈方在今后阶段采取合作的态度，从而实现共同的长期利益。因此，重复博弈的次数会影响到博弈均衡的结果。

什么是策略空间？

策略空间（strategy space）是指博弈各方可供选择的策略或行为的集合。比如，一个参与人的所有可选择的策略集合就是这个参与人的策略空间。

策略集合指参与者可能采取的所有行动方案的集合。策略集合必须有两个以上元素，否则，无所谓对策，只是独自决策。

若参与者有有限个具体的策略可供选择，则称其有个有限策略集合。例如，在单一次剪刀、石头、布里，每一个玩家都有一个有限策略集合 {剪刀，石头，布} 。若有无限个具体的策略可供选择，则称其有个无限策略集合。例如，有规范出价增额的拍卖会有个无限策略集合 {$10， $20， $30， ...} 。另外，在分蛋糕问题里则有个连续的策略集合 {在蛋糕的百分之零至百分之百间的任一处切分} 。

Strategy直译应为“战略”，不过“战略”一词对大多数博弈来讲显然过于抽象和宽泛了。每一个策略都对应一个相应的结果。因此每个博弈方可选的策略数量越多，博弈就越复杂。

你知道抽彩悖论吗？

第11章 博弈(1)

第11章博弈(1)