1.1 深入理解选择行为
本节将从我们生活中常见的出行选择问题出发,透过表象探究本质,再映射到选择行为的经济学理论,包括理性人选择理论、效用理论及揭示性偏好理论,最后引出选择行为的计量分析框架—离散选择模型。
1.1.1 选择无处不在
人们日常生活中绝大多数的决定和行为,都涉及选择:早上去上班,我们需要决定通勤方式;去食堂吃饭,我们需要选择菜品;购买一台冰箱,我们需要选择品牌和型号。随着经济的快速发展,人们的物质和精神生活日益丰富,面临的选择也越来越多。作为数据分析师,在面对常见的选择行为分析问题时,应该在数据之外深入思考这些选择行为的本质。下面以选择出行方式为例,剖析选择行为的具体逻辑,为后面的学习做好铺垫。
1. 出行选择的场景还原
出行就是“在某时从A点到达B点”,这一行为主要面临的选择是“以什么方式前往”,回想一下我们平时做出行选择时是否有如下参考信息浮现在脑海。
- 可以选择的交通方式有哪些?
- 同程的人多不多?
- 需要在什么时间到达目的地?
- 出行的预算是多少?
- 公共交通的便捷程度如何?
- 出行方式是否受天气影响?
通常,我们会带着这些疑问打开出行类App看看各类交通方式的花费、耗时及路线,可能还会打开天气App看看未来一段时间是否下雨、是否有严重的雾霾,如图1-1所示。
图1-1 打开App查看出行路线和天气
2. 出行选择的决策逻辑
接下来,我们通过一个更加具体的案例说明出行选择的决策逻辑:有200个家庭要进行家庭旅行,每个家庭的情况不同(包括出行人数、目的地、家庭年收入等),每个家庭都会在飞机、火车、长途汽车及自驾车中选择一种作为出行方式。
不同的家庭会有不同的选择,在选择的表象下有着相似的决策逻辑。我们尝试置身于这个场景中,在大脑里构建一张类似图1-2的打分表。出行方式的属性可以主要归结为行程外(等车)耗时、行程中耗时、行程花费、舒适性等。确定这些出行方式的属性后,再结合自身属性(家庭收入、出行人数等),对每个选项进行定性/定量的排序,得到最适合自己的选择结果。
图1-2 旅行出行方式打分表
在选择的过程中,如果某个因素发生变化,就有可能对选择结果产生影响。例如:其他因素保持不变,由于航空公司促销,机票价格比火车票还便宜,你的选择是不是会从火车改为飞机呢?再假设,临行前你收获一笔超过预期的奖金,可支配的现金增多,是不是也会从火车改为飞机呢?
回忆一下我们生活中其他方面的选择,其实也秉持类似的方式。经济学家、心理学家经过长期研究,发现人类个体间的“选择之道”存在较高的相似性,对这些相似性加以总结就形成了一系列选择行为的经济学理论。这些长期沉淀下来的理论对于数据分析师来说是非常有价值的,它不仅能帮助我们从本质上理解相关计量选择模型的原理,还能在对业务方进行分析阐述时有理论背书。下面我们开始学习选择行为的经济学理论。
1.1.2 选择行为的经济学理论
选择行为主要有两个经济学派别,分别是理性人选择和行为经济学。尽管行为经济学在某些方面对理性人选择提出了挑战,但理性人选择仍然是群体选择行为分析的主流理论框架。本章后续内容均基于理性人选择理论。
1. 理性人选择理论
理性人选择是指经济决策的主体是充满理智的,他们对于所处环境具有完备的知识,能够找到实现目标的所有备选方案,有稳定且清晰的偏好,拥有很强的计算能力,能预测每种方案的选择后果,并依据某种衡量标准从这些方案中做出最优选择,选择的唯一目标是自身经济利益最大化。
结合上文的出行案例,我们先来解释什么是理性人选择。当我们选择出行方式时,首先确认每种交通方式的重要属性(行程外耗时、行程中耗时、行程花费、舒适性)、自身属性(家庭收入、出行人数)和客观因素(天气),然后基于这些信息为每个方案计算一个偏好值并排序,最终选择偏好值最大的选项。如果选择了自驾车,那么说明综合多种因素,自驾是最能获得满足感的出行方式。
2. 效用理论
消费者内心的满足感其实可以用一个经济学的词汇来表示,即“效用”。依照每种选择方案的“效用”排序进行选择的过程叫作“效用最大化”,这就是理性人选择理论最常用的准则。学术上的描述是当消费者面对一系列备选商品的时候,他们会清楚地计算出每个商品的效用,并严格将所有商品按照效用排序,选择效用最大化的商品。
读到这里你也许会有疑问,尽管我们认同选择时基于理性人选择理论,但如此抽象的理论怎样才能在实际的数据分析中发挥作用呢?哪怕知道了影响选择行为的因素,也无法得出效用的计算公式。此时,我们需要继续学习揭示性偏好理论。
3. 揭示性偏好理论
揭示性偏好理论由美国经济学家保罗·安东尼·萨缪尔森提出。该理论表明:可以结合消费者历史消费行为,分析消费者偏好,通过统计分析的方式得到相关因素的量化影响。该理论有以下两个重要假设。
1)消费者在进行实际消费行为时,若从备选方案中选择了一个选项,即为首选选项,则该选项效用是最大的。
2)在给定的消费者预算、商品价格等因素不变的情况下,如果消费者购买了某种产品,那么他将始终做出相同的选择。
在该理论提出之初,包含的影响因素有消费者预算、商品价格以及其他商品或消费者属性。对这些因素进行归纳和拓展,再结合上述假设,就形成了离散选择模型的模型框架。
1.1.3 离散选择模型
了解了必要的理论知识后,我们开始学习离散选择模型(Discrete Choice Model,DCM)。DCM不是单一模型,而是一个模型簇,它包含了一系列应对不同选择场景的模型,例如逻辑回归(Logistics Regression,LR)模型、多项Logit(MultiNomial Logit,MNL)模型及嵌套Logit(Nested Logit Model,NL)模型等,在1.2节、1.3节中会深入介绍这些模型的使用方法。
图1-3 离散选择模型的元素及结构
如图1-3所示,DCM主要包括5个部分,分别是决策者(决策者属性)、备选项集合、备选项属性、决策准则和选择结果,数学表达形式如下。
选择结果 = F(决策者,备选项集合,备选项属性)
其中,F是决策准则,即效用最大化准则。模型最终实现的功能是在给定决策者、备选项集合、备选项属性后,基于效用最大化准则,得到选择结果。
回到旅行出行方式选择的案例中,我们对例子中的元素进行映射。
- 决策者:一次选择行为的主体(决策者属性包括家庭收入、出行人数、天气)。
- 备选项集合:飞机、火车、长途汽车、自驾车(不同决策者的备选项集合可以不同)。
- 备选项属性:行程外耗时、行程中耗时、行程花费、舒适性(不同备选项的属性也可以不同)。
- 选择准则:效用的最大化准则。
- 选择结果:备选项中的一个选项(每个选择过程均存在选择结果)。