1.2 BI分析行业现状与BI的职责
1.2.1 没有什么不在被数字化
硅谷创业之父Paul Graham在《黑客与画家》中曾谈到,如果希望自己的作品对未来的人们有吸引力,方法之一是让你的作品对前面几代人有吸引力,如果你的作品对今天以及1500年以前的人都有吸引力,则极有可能也会吸引未来的人。
历史上没有哪个时期像我们当下面临的这个时代如此瞬息万变。降低不确定性的较好的方式,可能是先了解过去,找出纷繁复杂的世界中那一抹稳定的发展动力,而后进行推理和演绎。陆奇早在2020年就已经做了这件事。
陆奇在奇绩论坛中讲到创业者的机会时,重点强调了数字化的机遇,其实这部分主要引用自大卫(David Christian)的《极简人类史》,其中有一部分与本书所关心的主题相关,那就是经济发展与技术发展的联系越来越紧密,而其核心结构是能源和信息。基本上所有时代的经济发展的范式和体系,都是由能源和信息的结构组合来决定的,并依托于另外一个驱动因素——通用技术GPT(General Purpose Technologies,GPT)——来组织人类生产活动,产生GDP。
1.社会时期演进
历史上人类社会有三大比较稳定的范式,如图1-5所示。
图1-5 人类社会经历的三大比较稳定的范式(来自陆奇:奇绩论坛分享)
第一是农业体系,能源很特殊,是免费的太阳能,产能主要取决于有多少亩土地,其上的作物在适当的温度条件下通过光合作用生长,变为资源。该体系下的信息流程比较简单,工具也比较简单,人的行为也比较简单,基本是靠人本身的劳动力。
第二是工业体系,工业体系的能源是化石能源,主要的能源形式是电,这就需要设备,如电机设备、基建设备、电器、电子设备等。在工业体系中,人需要做得更多,因为信息结构改变自然现象的过程更复杂。对应地,这时人的行为变得更复杂,当时出现了大规模的培训,大学也产生于这个时期。
第三,也就是现在,我们处在信息、数字化驱动的时代,总共才有60多年的历史,以20世纪通用计算机的出现为起点,人类获得信息、处理信息的能力在不断地快速提高。这个时代的核心能源是各种新兴能源——不断通过数字化,从信息中获得知识,用知识快速地重新组合出新的能源形式、新的技术、新的材料、新的生命过程,以满足人类的需求。人掌握的技能已经不够用了,人需要的能力是创新组合的能力。
从我们所处的数字化驱动的时代来看,也有一些稳定的规律可循。数字化的进展主要依赖前、后平台,其中前台代表交互能力,后台代表计算能力。前台是用户直接操作的界面,包括但不限于办公应用、浏览器、搜索推荐,以及电商、社交、服务零售等领域的应用,而这些应用依托于关系型数据库、云服务、深度学习平台等坚实的后台计算能力。当然,数字化本身也在一刻不停地沿着更广、更深的方向发展,如图1-6所示。
(1)早期PC时代,数字化主要应用在企业信息流通与信息管理,代表企业有微软等。
(2)进入Web/互联网时代,图文信息、商品流通、用户的兴趣爱好等纳入数字化领域,代表企业有谷歌、亚马逊、Facebook等,国内有百度、阿里巴巴、腾讯等。
(3)接下来进入移动互联网时代,我们的日常生活服务也被纳入进来,支付、出行、外卖也进入线上服务范围,代表公司有支付宝、滴滴、美团等。
(4)而后就是AI时代,标志性事件一个是AlphaGo的诞生,另一个是ChatGPT的爆发。当然这仅仅是一个开始,按照信息演进和应用场景扩展的固有趋势,智能信息在生物领域、自动化领域中释放出生产力指日可待。
图1-6 数字化的演进缩影
下面我们再从微观的视角观察一下渗透在我们日常生活中的数字化演绎。
2.沟通方式演进
从沟通方式演进的角度来看数字化演绎过程。从飞鸽传书到电报,到固定电话、移动通信、视讯,再到现在的AR、VR和元宇宙,可以归纳为两个发展轨迹:
· 交流使可以交换的信息越来越多维,交换信息的延迟越来越小。
· 沟通方式和工具的迭代速度越来越快。
如图1-7所示,沟通方式的演进经历了如下四个阶段:
(1)飞鸽传书只能传送有限的文字字符,并且需要等待数日,且不确定性极高。如果鸽子中途被拦截,就有可能收不到信息。
(2)1837年,美国人莫尔斯发明了电报机,随着电报技术的发展,电报成为了19世纪末和20世纪初最主要的通信手段之一,极大地提高了信息交换的及时性与确定性。
(3)1876年,苏格兰裔美国人亚历山大·格雷厄姆·贝尔发明了电话。电话与电报在通信技术上有很大的不同,电报通过电报机发送电信号来传递文字信息,而电话则通过语音信号传递人类声音。电话的发明彻底改变了人们的通信方式,使得人们可以实时地进行语音交流。随后,移动通信让信息交换进一步摆脱来自时间和空间的约束,并使实时视频信息交换成为可能。
(4)现在依托腾讯会议、Zoom等公司的线上沟通解决方案,信息交换场景又进一步扩充,多人实时交换信息也不再受物理地点的约束。
飞鸽传书可以追溯到公元前5世纪左右,到电报、电话的发明,其间经过了约2300年,而从电报、电话的发明到Zoom等多人协同会议软件的普及,经过了约150年。这一趋势也使以Meta(原Facebook公司)为首的业界巨头加大对基于AR/VR的信息交互工具以及元宇宙的投入,并积极地探索迭代信息交互场景。
图1-7 沟通方式演进缩影
3.购物方式演进
接下来从购物方式演化的角度,可以发现购物选项及体验中也有稳定的演绎逻辑可循。
(1)2000年之前,消费者主要的购买方式是去线下实体店货比三家。
(2)后来电子商务出现,阿里巴巴通过淘宝、天猫等应用把线下店铺和货物信息迁移到线上,消费者可以在电脑屏幕上在更大范围内货比三家。
(3)接着京东进场,承诺只卖正品,从电脑、手机等电子品类切入,通过提高购买货物的正品率极大地降低了线上购物的交易成本。
(4)再后来拼多多出现,依托微信,下沉三四线城市,接入夫妻店,进一步扩大用户和商品的辐射匹配范围,并利用微信社交关系网,将“熟人”的建议纳入购买决策中来。
(5)现在淘宝、抖音、快手的直播电商,将线下“导购”职能迁移到线上,信息交换从文字、图片变为实时视讯,通过更翔实的货品介绍进一步扩充电子商务的品类范围,通过可互动的沟通方式实时答疑,使消费者做决策更容易。
从原本只有传统线下实体店,到目前阿里巴巴、京东、拼多多等电商平台,以及近期兴起的直播电商,发展趋势遵循的逻辑都有哪些呢?
· 供给侧:货品被数字化并搬到线上,且被数字化的货品范围越来越广。
· 需求侧:用户渗透在持续加快,从一二线城市进一步渗透到三四线城市。
· 交易效率:购买决策可依托的信息维度越来越多,决策成本越来越低。
不难发现,不管是从人类历史演进的角度来看,还是从信息产业发展的视角和我们可以体验到的日常生活的变化去推理,几乎没有什么是不被数字化的。当然,我们改变世界的效率在呈指数提升的同时,我们面临的这个世界的复杂度也在不断提升。面对更加复杂快速运转的世界,我们学习这个世界的能力应该不断强化,掌握尽可能多的信息,快速有效地将纷繁复杂的信息学习归类,将信息提炼为知识,再让知识变成创造价值的生产力,显得尤为关键。提出高质量问题,并提供高质量解决方案,获取信息、提炼知识、支持决策并创造价值的能力的重要性不言而喻。
1.2.2 我们相信上帝,但其他人必须提供数据
“我们相信上帝,但其他人必须提供数据。”(In God we trust, all others must bring data.)这句话由美国统计学家W. Edwards Deming强调在商业和工业中使用数据和统计方法进行决策和提高决策质量的重要性时提出。这句话也是全球最大的金融信息企业彭博(Bloomberg)所秉持的重要企业文化之一,强调数据在决策场景下的不可替代性。
BI分析并不是一个新兴的行业,在1.1.2节回顾BI分析历史的时候也曾提到过。然而,随着互联网应用场景的不断丰富,这一领域的重要性正在逐渐提升。由于互联网行业是信息产业的集中体现,所以在数据应用方面,互联网行业比其他产业更早、更全面、更深入。这种经验积累在商业智能领域得到了充分体现,各大互联网企业都建立了成熟的商业智能团队,用数据支持企业级别的决策,并创造业务价值。
BI团队几乎是所有互联网公司的标准配置,BI团队的架构设置参见2.2.1节。BI团队负责为整个企业提供及时、准确、稳定的数据,使企业运营做到有“数”可依,企业的资源配置的决策、各级别的讨论与业务决策可以摆事实讲道理。换句话说BI团队驱动企业科学的运营与管理。
在互联网企业中,基本角色包括产品经理、运营人员、研发人员和数据分析人员。产品经理负责规划和设计产品,并控制产品研发过程,最终使产品功能能够满足用户需求;研发人员负责功能实现;运营人员将产品的功能和价值最优地展现在用户面前,培养用户使用习惯,引导用户行为以实现产品的最终目标;数据分析人员则为各职能部门提供决策支持。当然,不同公司所处的细分赛道和发展阶段不同,每个角色在企业决定做什么、不做什么时的话语权和站位也会有所差异。例如,在工程师文化较强的公司(如百度),研发人员会更主动一些;而在一些对产品的把握与感知更强的公司(如腾讯),产品经理会更积极地参与决策;在重运营的业务模式的公司(如美团、滴滴),则更多由运营人员提出需求,产品经理和研发人员分步实现。不管怎样,互联网公司的核心角色基本上可以归纳为上述四种。
1.2.3 BI团队的职责
简单来说,BI团队负责的工作包括获取信息、提炼知识、创造价值。
1.获取信息
· 要保证公司有数据可用,即有合理的关键指标体系,来保证公司业务可以被及时呈现。
· 定期收集问卷、访谈等调研数据,以定性信息补充业务视角。
· 基于业务场景,有序管理外部数据源数据,补充业务视角。
· 规划并进行数据治理与建设,确保数据准确、及时、稳定,且内部、外部数据以可提升业务价值的方式融合管理。
2.提炼知识
· 对于“这个业务能不能做?如果做有没有胜算?”等问题,需要搭建经营模型,定期做盈利模型、市场适配性诊断,要支持运营、产品、研发部门进行常规业务时的数据需求,做到业务执行上的决策有“数”可依。
· 对于“现在业务现状怎么样?是否需要调整?”等问题,需要进行日、周、月维度的业务诊断,通过运营策略与指标变化识别系统性风险。
· 对于“业务、产品部门的工作是否有‘数’可依?”等问题,需要支持业务与产品策略、功能迭代,进行科学的实验设计与效果回归,作为业务迭代的科学依据。
3.创造价值
· 对于“用户是否对我们满意?有没有我们错过的信息?”等问题,需要聚焦用户体验,关注留存率、流失率等用户指标,结合用户差评全面描述体验,扫除业务感知盲点,提出解决方案。
· 对于“有没有见本增效的空间?有没有用数据来代替人的决策并产品化提升整体效率的空间?”等问题,需要用算法替代人工决策的过程,聚焦现有业务逻辑,通过提炼运营最佳实践,增强提高组织与产品功能提效所带来的规模效应。
· 对于“其他公司的优势是哪些?是否适用于我们公司?”等问题,基本上需要用爬楼梯法,学习各个领域里最好的解决方案,布局长期发展,不断提炼行业最新实践,探索新的商业可能性。
但往往理想是丰满的,现实是骨感的。就如高考的考点范围有明确的边界,评分有明确的量化标准,考生只要按要求掌握这个范围内的知识点就可以考满分。而事实上,高考只有极小概率有满分出现。同理,虽然大家都比较清楚应该用信息去支持决策,却很少有分析团队把“获取信息—提炼知识—创造价值”三个方面都做好,更多的只发挥了第一个或前两个作用,详见1.2.4节。
1.2.4 BI团队的常见分类
事实上,现实生活中较常见的BI部门可以按照企业里的责任边界与角色定义,分为报表型BI团队、支持型BI团队、智囊团型BI团队三种类型。
· 报表型BI团队:俗称“提数部门”,突出的特征是团队的工具属性较强。业务和产品人员要什么数据,团队就出什么数据,要什么看板就建什么看板。至于数据解决哪些问题、有没有业务价值,团队不会过多参与思考和讨论。
· 支持型BI团队:不仅做报表型团队的工作,还会参与讨论,看业务和产品人员所规划的是否是有意义的需求、有意义的产品。
· 智囊团型BI团队:除了上面两类事务,还需要做业务价值判断,即这样做能不能增加业务价值,有没有业务影响力;主动通过业务诊断、用户分析等,提出如何做业务和产品才能带来更多业务价值,探索新的商业可能性,真正做到数据驱动。
一个不太乐观的观察是,至少一半以上的有志推进业务数据驱动的BI团队最终妥协为报表型BI团队,如图1-8所示:团队中的分析师无奈地称自己为“表弟”“表妹”,勤勤恳恳地建设数据、搭建看板供业务使用、接受大量的提数需求,但很少做与分析相关的工作,这也成为分析师离开原岗位寻找新机会的主要原因之一。剩下一半的BI团队中,或许可以参与执行层面的决策探讨,但他们多半属于支持型角色,其影响力只限于产品功能或业务策略上的封闭型任务,如实验设计或效果回归等。只有极少数的团队可以在以上两个角色的基础上,在企业级别决策支持或企业核心功能策略应用上发挥影响力,输出启发性的分析报告甚至带来系统变化的迭代。
图1-8 惆怅的分析师(通过OpenAI生成)
但互联网受数据驱动至少十年了,有没有最佳实践可以提炼要素与规则,提高从0到1建设数据驱动的BI团队机制的效率?这正是本书重点想要讨论的部分。