第三章 博弈论中的重要规则:在规则的围城里如何生存
纳什均衡:两败并不俱伤
纳什均衡是博弈的结果,也是博弈双方的最优选择。“斗鸡”博弈存在纳什均衡,混合策略中也存在纳什均衡,我们选择了纳什均衡,也就等于采用了占优策略。
什么是纳什均衡
纳什均衡是指这样一种均衡:在这一均衡中,每个博弈参与人都确信,在给定其他参与人战略决定的情况下,他选择了最优战略以回应对手的战略。也就是说,所有人的战略都是最优的。
在知道对方策略的前提下,寻找一个合理的策略,而这个合理的策略,势必要建立在一个牢固的基点之上,才能切实可行。这样就达到了一个纳什均衡。
《红楼梦》里面形容四大家族的时候,用过一个评语,叫做“一荣俱荣,一损皆损”,就是因为这四个家族你中有我,我中有你,相互之间有利益的合作,也有亲缘关系,所以结成一个牢固的联盟。同样,如果两个同时处在困境中的人,也有这种利益—亲缘的双重关系,他们合作起来就会更加容易,而且形成的合力就会更大,正所谓“二人同心,其利断金”。而要做到“同心”,合作是不够的,还需要一种近乎亲情的亲缘关系。显然,这是可遇而不可求的,因为亲缘关系不是能够随便形成的。在红楼的家族里属于合作性的博弈,牵一发动全身,都是相关的,他们彼此都知道其他人的策略,并且自己选择和他们合作的策略,所以红楼里四大家族联合成一体,从而不会产生不知道对方策略的困境,而恰好是每次选择都是一个纳什均衡,比如薛蟠打死人后,贾府的庇护,贾与薛家的选择就成了一个纳什均衡。
纳什均衡的意义
纳什均衡是人们用来分析从商业竞争到贸易谈判种种现象的有力工具,是对博弈论的重大发展,甚至可以说是一场革命。
首先,纳什均衡对亚当·斯密的“看不见的手”的原理提出挑战。按照亚当·斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。
亚当·斯密认为:“通过追求自身利益,人们常常会比其实际上想做的那样更有效地促进社会利益。”从“纳什均衡”我们引出了“看不见的手”的原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。两个囚徒的命运就是如此。从这个意义上说,“纳什均衡”的悖论实际上动摇了西方经济学的基石。
诺贝尔经济学奖获得者萨缪尔森有句名言:你可以将一只鹦鹉训练成经济学家,因为它所需要学习的只有两个词:供给与需求。博弈论专家坎多瑞引申说:要成为现代经济学家,这只鹦鹉必须再多学一个词,这个词就是“纳什均衡”。
对于“纳什均衡”我们还可以悟出这样一条真理:合作是有利的“利己策略”。但它必须符合以下条件:按照你愿意别人对你的方式来对别人,但只有他们也按同样方式行事才行。也就是我们所说的“己所不欲,勿施于人”。但前提是人所不欲,勿施于我。其次,“纳什均衡”是一种非合作博弈均衡,在现实中非合作的情况要比合作情况普遍。所以“纳什均衡”是对冯·诺依曼和摩根斯坦的合作博弈理论的重大发展,甚至可以说是一场新的革命。
从“纳什均衡”的普遍意义中,我们可以深刻领悟到司空见惯的日常生活中的博弈现象。
作为理性人,比如现实中的许多争吵,大到国家间的领土争端,小到人与人之间的鸡毛蒜皮的小事,很大一部分都是博弈双方的纳什均衡。这种争吵或者由于一方认为不公平造成,或者由于双方均认为不公平造成。
曾有这样一个故事:杰克和吉姆结伴旅游。经过长时间的徒步,到了中午的时候,杰克和吉姆准备吃午餐。杰克带了3块饼,吉姆带了5块饼。这时,有一个人路过,路人饿了,杰克和吉姆邀请他一起吃饭,路人接受了邀请。杰克、吉姆和路人将8块饼全部吃完。吃完饭后,路人感谢他们的午餐,给了他们8个金币,路人继续赶路。
杰克和吉姆为这8个金币的分配展开了争执。吉姆说:“我带了5块饼,理应我得5个金币,你得3个金币。”杰克不同意:“既然我们在一起吃这8块饼,理应平分这8个金币。”杰克坚持认为每人各4块金币。为此,杰克找到公正的夏普里。
夏普里说:“孩子,吉姆给你3个金币,因为你们是朋友,你应该接受它;如果你要公正的话,那么我告诉你,公正的分法是,你应当得到1个金币,而你的朋友吉姆应当得到7个金币。”
杰克不理解。
夏普里说:“是这样的,孩子。你们3人吃了8块饼,其中,你带了3块饼,吉姆带了5块,一共是8块饼。你吃了其中的1/3,即8/3块,路人吃了你带的饼中的3-8/3=1/3块;你的朋友吉姆也吃了8/3,路人吃了他带的饼中的5-8/3=7/3块。这样,路人所吃的8/3块饼中,有你的1/3块,有吉姆的7/3块,所以公正的是你只能得一块金币。这种分法符合纳什均衡的原则,按这样来分,你只能得一个金币。”经夏普里这样一说,杰克也不再嚷着多分了。最后杰克与吉姆达成协议,杰克只要了3个金币。经过双方的博弈,双方的选择符合纳什均衡,因为杰克再多要一个金币,吉姆就不平衡了,而吉姆再多要一个金币,杰克也不平衡了。所以杰克3个金币、吉姆5个金币是双方的最佳选择。