2.1 扩展型博弈
以博弈树(game trees)展示的博弈就叫作它的扩展型博弈(games in extensive form)。扩展型博弈的优点是直观详尽,表明了参与博弈的每个局中人及其参与博弈的次序、行动(着)的选择、博弈路径和相应的博弈结果。一言以蔽之,扩展型博弈表现了博弈的整个动态过程。
2.1.1 博弈树
博弈树包含一个节点集P和一个有向线段集E。P中每个节点或者是E中某些有向线段的前端点,或者是E中某条有向线段的后端点,或者同时“身兼二职”。每条有向线段的两个端点都是P中的节点。节点中有唯一一个不充当任何有向线段终点者,它称为博弈始点(starting node);节点中只充当有向线段终点者,每个都叫博弈终点(terminal nodes)。
在第1章的练习题1-1中,节点集包含共11个节点和10条有向线段;博弈始点标以N(自然界),6个博弈终点上每个都标出相应的赢得向量(payoff vectors)。
今后在没有特别说明的情况下,我们约定赢得向量的每个分量都是该局中人在相应结果中得到的效用。用数学语言描述是:一个扩展型博弈可以表示为T=[P,E,V],其中P是节点集,E是有向线段集,V是赢得向量集。
2.1.2 节点集的划分
节点集可以划分成互不相交的一些子集,比如机会节点[1](chance nodes)子集、决策节点(decision nodes)子集和博弈终点子集,其中决策节点子集还可以按属于不同的局中人进一步划分。在上题中,属于局中人1的决策节点子集包含两个节点,属于局中人2的决策节点子集也包含两个节点,不同之处在于局中人1能够区分他的两个节点,而局中人2却无法区分她那两个节点。同一个局中人不能区分的那些决策节点构成他(她)的一个信息集(information set)。因此,局中人1有两个信息集,每个都是单点集;局中人2只有一个信息集,是个双点集。当一个信息集包含多个节点时,我们用虚线把这些节点连接起来。
2.1.3 信息集与(纯)策略
信息集是局中人决策的地点所在。每个信息集中每个节点都是相同数目的有向线段的前端点,每条有向线段代表局中人在该信息集选择的一着(move,action)。一个局中人在他的每个信息集都选定一着,这就给出他的一个(纯)策略(pure strategy)。局中人选定的策略是他参与博弈的一个完整计划。在练习题1-1中,局中人1有两个信息集,分别对应于红牌和黑牌;他在每个信息集上都可以选择开牌或加注两个不同的着之一,所以他共有4个不同的策略:开牌-开牌,开牌-加注,加注-开牌,加注-加注。每个策略前半部分是得到红牌时的决策,后半部分是得到黑牌时的决策。另一方面,局中人2只有一个信息集,她在此选的每一着就是一个策略,所以有2个策略:跟进和认输。
2.1.4 策略组合
如果每个局中人都选定一个策略,我们就得出一个(纯)策略组合(pure strategy profile)。给出一个策略组合,加上自然界在机会节点上的随机选择,就得到连接博弈始点和某些博弈终点的一条或多条路径(paths)。这些路径表明博弈的进行过程和结果,人们可以据此算出各局中人的赢得或期望赢得。
在练习题1-1中,假设局中人1的策略是加注-加注,假设局中人2的策略是跟进;这时依照自然界的随机选择,得出两条路径:①N-红牌-1的上节点-加注-2的上节点-跟进-赢得向量(2,-2);②N-黑牌-1的下节点-加注-2的下节点-跟进-赢得向量(-2,2)。这两条路径各以概率0.5出现,所以策略组合〈加注-加注,跟进〉相应的期望赢得向量为:
0.5(2,-2)+0.5(-2,2)=(0,0)
附注:今后在博弈树中,我们用粗线条(或双线条)表示各局中人在每个信息集选定的着。比如,图2-2表示出练习题1-1中局中人选定的策略组合〈加注-加注,跟进〉。
图2-2 练习题1-1中局中人选定的策略组合
[1] 自然界(N)做选择的节点称为机会节点。