现代决策树模型及其编程实践:从传统决策树到深度决策树
上QQ阅读APP看书,第一时间看更新

1.5.2 基于决策分析流程的决策树

1.5.2.1 需要变更决策树实例

生活中的决定和不确定因素比比皆是。就拿决定去哪里度假这么简单的事情来说,是去附近的山,因为你的朋友喜欢,还是去远处的海滩,因为你自己喜欢?住在海边可能会便宜一些,但需要较长的旅行时间,而去山上可能会贵一些,但能更早到达那里。你会选择哪个方案?或者,你要重新装修房子,需要在两个承包商之间做出选择。承包商A的费用比承包商B高,但B有很大的可能性(或者说概率)拖延工期,而A按时完工的可能性更大。你会选择哪个承包商?

在这两种情况下,投资和时间方面都存在不确定性。在做决定时,你会仔细考虑各种选择及其可能的结果。你很可能会选择价值最高的结果或负面影响最小的结果。不确定因素导致风险,在对风险采取行动之前,需要对风险进行定性和定量的分析,量化风险可帮助我们获得信心。PMBOK中关于决策树分析的计算方法的例子很详细,这里我们援引项目管理社区经常使用的一个例子来说明如何运用决策树分析法进行项目风险决策分析。

首先以风险型决策分析流程为例,看看决策树的应用。在不确定因素的背景下,需要对可能出现的风险进行定量分析,从而做出有利决策。在若干备选方案中,分析不同分支事件发展路径的发生概率及产生的风险(包括威胁和机会),计算每条路径的净值,根据预期收益选出最优路径。在针对风险型决策分析流程的建模中,决策树的要素包括决策点(根节点,决策的出发点)、方案枝(决策的若干备选方案)、机会点(每个方案枝在各种自然状态下的收益结果)、概率枝(每种自然状态对应的发生概率)及结果点。由决策点出发,从左到右根据需要决策的问题、可供选择的各种方案、各种方案的自然状态绘出决策树图,如图1.7所示。

图1.7 风险型决策分析中的决策树示意图

首先要明确有哪些备选方案:决策树分析要解决的正是可选方案太多的“痛苦”。假设某个以新增利润为目标的项目交付过程中,业务方发现了新的商机,发起了一项需求变更,让业务方“痛苦”的可选方案有:

●方案1:实施变更,但上线计划要推迟1个月,研发费用增加100万元。

●方案2:当前版本保持现状,下个版本(2个月后)实现新需求方案,研发费用增加80万元。

●方案3:当前版本实施临时方案,效果不能完全实现,下个版本(2个月后)再完成最终方案,研发费用增加120万元。

实际情况可能更复杂,某个备选方案自身可能就是一个决策点,这种情况就需要把这个决策点看成一个整体,绘制多阶决策树。

其次要分析各项概率枝及预期收益:这是决策树的关键,直接影响着最终决策的准确性及有效性。这里有两个重点:

●概率枝的考虑要尽可能全面。

●各个概率枝发生的概率和预期收益要尽可能准确,可以结合数据、趋势、环境及专家评估等工具和手段。

继续需求变更的例子,三项变更实施方案最主要的差异在于新商机方案投产时间对于收益的影响。通过对类似方案的运营情况及历史数据的分析,方案3采用了临时方案的折中方案,可能会有一定概率出现1200万元利润的情况,方案1和方案2受投产时间影响,只可能出现1000万元和1500万元利润的情况。

于是,通过上面的两个步骤,决策分析树基本可完成绘制,如图1.8所示。

图1.8 需求变更决策树示意图

根据图1.8计算预期收益和期望值,方案1的预期收益最高,自然就是最佳决策方案。

1.5.2.2 合作方排期决策树实例

决策方案的确定并不意味着风险已经解决,只是在当前不确定因素的前提下综合发生概率集所做出的最佳决策。而针对其中的不确定因素,还需进一步进行风险识别并将其记录到风险等级册,制定有效的风险应对措施,增加正面预期收益的发生概率,降低负面收益的发生概率。

进行预测性分析的关键点有两个:决策点的有效分类和决策点的发生概率分析。

1. 决策点的有效分类

决策点的分类通常需要遵循以下原则:

●节点包含的样本具有相同的属性。

●节点中的样本属性无法再细分。

●当前节点已经是最终节点,无法继续划分。

例如,项目组识别到某个需求依赖外部合作方配合排期的风险,经分析,对可能的节点进行归纳,绘制出图1.9的决策树。

图1.9 合作方排期决策树示意图

从图1.9的划分可以看出,不管是由谁要求业务方协调排期,都是同样的属性,可以归成同一类;风险解决节点达到了风险应对的效果,无须再划分;上升到决策委员会则是风险解决的最终策略,无法再进一步划分。

2. 决策点的发生概率分析

根据每个决策事件,进一步分析其发生概率,计算每个决策结果发生的最终概率,从而把更多的精力放到高概率决策结果的应对中去。根据图1.9中每个决策节点的概率,易知最终调整我方排期并跟相关方达成一致的概率最高,如表1.1所示,应将风险应对的重点放在这之前的过程上。

表1.1 合作方排期决策树中各决策节点发生概率

1.5.2.3 EMV分析及实例

决策树分析使用图表(决策树)来协助项目负责人和项目组做出困难的决定。决策树展示了正在考虑的决策,并沿着不同的分支展示了选择一条路径或另一条路径可能产生的影响。决策树分析通常是在未来的若干结果仍不确定的情况下进行的,形式上是一种头脑风暴,有助于确保所有因素都得到适当的考虑。决策树分析要考虑未来要做的每一个事件和决策的概率、成本和回报等诸多因素。该分析还使用预期货币价值分析[Expected Monetary Value(EMV)Analysis]来协助确定每个备选行动的相对价值。

所谓EMV分析是当某些情况在未来可能发生或不发生时,计算平均结果的一种统计方法(不确定性下的分析)。EMV表征风险对整个项目目标的影响,积极的机会的EMV通常表示为正值,而消极的威胁的EMV则表示为负值。EMV是建立在风险中立的假设之上的,既不避险,也不冒险。把每个可能结果的数值与其发生的概率相乘,再把所有乘积相加,就可以计算出项目的EMV,公式如下

EMV=风险概率(P)×风险影响(I)

例如,一个负面的风险(或威胁)有10%的概率会禁止一个工作包的执行。如果该风险发生,不执行该工作包的影响估计为负40000。对于同样的工作包,存在15%的概率的正风险,影响估计为正25000。是否应该执行这个工作包?分析可知:

威胁的EMV=P·I=10%×(-40000)=-4000

机会的EMV=P·I=15%×(+25000)=+3750

总的EMV=-4000+3750=-250

很明显,不应执行这个工作包,因为这会导致赔钱。当一个工作包或活动与风险相关联时,可以尝试计算其EMV。换句话说,可以量化单个风险。

以上计算的是单个工作包的EMV,那么整体项目的风险应如何量化呢?对于有很多工作包的项目,可以将每个可能的结果(影响)的价值乘以其发生的可能性(概率)来计算EMV,然后将结果相加。EMV的一个常见用途是在决策树分析中使用。

1.5.2.4 决策树分析及实例

决策树分析(Decision Tree Analysis,DTA)在内部使用EMV。当项目需要做出某种决策、选择某种解决方案或者确定是否存在某种风险时,EMV分析提供了一种形象化的、基于数据分析和论证的科学方法。这种方法通过严密的逻辑推导和逐级逼近的数据计算,从决策点开始,按照所分析问题的各种发展的可能性不断产生分支,并确定每个分支发生的可能性大小以及发生后导致的货币价值多少,计算各分支的EMV,然后将期望值中的最大者(若求极小,则为最小者)作为选择的依据,从而为确定项目、选择方案或分析风险做出理性而科学的决策。以下是DTA示意图中的一些关键点:

●DTA需考虑未来的不确定事件。事件名称被放在矩形内,从矩形上画出选项线。

●在画决策树时,会有决策点(或“决策节点”)和多个机会点(或“机会节点”)。每一个点都有不同的符号:填充的圆形节点是“决策节点”;填充的菱形节点是“机会节点”;填充的五边形是决策树中一个分支的末端,即结果节点。各类节点如表1.2所示。

表1.2 DTA示意图中各个形状所对应的节点

分析决策树时,从决策节点(填充的圆形)开始从左向右移动。决策节点是分支开始的地方,每个分支都可以通向机会节点(填充的菱形)。从机会节点开始可以有进一步的分支。最后,分支将以结果节点结束(填充的五边形)。

接下来对树的分支进行计算。计算时,在树上从右向左移动。成本值可以在分支的末端,也可以在节点上。只要按照分支进行计算就可以了。最后的决策是根据不同的情况,给出最高的正值或最低的负值的选项。

下面通过一个例子来了解DTA的实际应用。假设你正在为项目做原型,但你不知道是否要继续这个原型。如果做原型,将花费10万美元;当然,如果不做,就没有成本。如果做原型,原型有30%的可能性会失败,成本影响为5万美元;如果原型成功,这个项目就能赚50万美元。如果不做任何原型,你已经在冒风险了,风险的概率是80%,失败的影响是25万美元。但是,如果没有原型且获得了成功,这个项目也会赚到前面提到的钱数。你应该怎么做?

图1.10 原型项目中第一分支的DTA示意图

现在开始分析,从左边开始,从左向右移动。首先,在事件的矩形中画出事件“做原型吗?”。这显然会导致一个决策节点(图1.10所示的填充的圆形节点)。从那里开始有两个选项——“做原型”和“不做原型”,它们也被放在图1.10所示的矩形中。

每个选项将导致两个事件或机会——成功或失败,它们将从机会节点上分支出来。以第一个选项为例,如果它有30%的概率失败,其影响将是5万美元。如果它成功了(有70%的概率),则没有成本,并有50万美元的回报。这些都在箭头上注明。同样,对于第二个决定,“不做原型”也有类似的分支,如图1.11所示。

通过观察,你能得出什么结论吗?不能。所以我们需要做EVM分析。计算EVM时,从右向左移动。首先,沿着决策树的每个分支计算净路径值。一条路径在分支上的净路径值是报酬减去成本的差值。接下来,在每个机会节点计算EMV。基于这些EMV,我们可以计算出决策节点的EMV。最终选择给出最高正值或最低负值的决策。

图1.11 原型项目中第二分支的DTA示意图

机会节点1(第1个填充的菱形)的EMV计算如下:

70%成功率的净路径值=Payoff-Cost=500000-100000=400000(美元)

30%失败率的净路径值=Payoff-Cost=-50000-100000=-150000(美元)

机会节点1的EMV=70%×400000+30%×(-150000)=280000-45000=235000(美元)

机会节点2(第2个填充的菱形)的EMV计算如下:

20%成功率的净路径值=Payoff-Cost=500000-0=500000(美元)

80%失败率的净路径值=Payoff-Cost=-250000-0=-250000(美元)

机会节点2的EMV=20%×500000+80%×(-250000)=100000-200000=-100000(美元)

这些结果如图1.12所示,结果节点用填充的五边形表示,其净路径值已经标注在图上。机会节点的EMV值单独标记在其附近。做原型与不做原型就是我们要决策事情。

图1.12 原型项目中净路径值的DTA示意图

你会采取哪种选择?看看决策节点的EMV(图1.12中填充的菱形所示)。选择分支中EMV最大的,就是做原型的EMV,即235000美元。如果选择另一个方案——不做原型设计——则会亏损。因此,应该选择做原型设计。

决策树分析可以应用于各种项目管理实践,在这些情况下,会面临各种选择或替代方案。

总而言之,决策树法是风险型决策分析中一个非常有用的领域。值得注意的是,决策树分析的应用不仅限于风险管理,还可以应用于人工智能(AI)中的机器学习和大数据分析中的数据挖掘。