数据掘金
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.3.5 为你的网店装上“业务雷达”

马云在2012年网商大会上的演讲中说过:“假如我们有了一个数据预报台,就像为企业装上了一个GPS和雷达,企业的出海将会更有把握。”这里说的就是数据运营的重要性。而这里的数据预报台就是商业智能(参见图1-17)。

图1-17 商业智能示意图

数据挖掘的最终目的是要实现数据的价值,而商业智能是在企业中实现数据价值的最佳方式之一。商业智能(Business Intelligence,BI)的概念最早是Gartner公司于1996年提出来的。当时将商业智能定义为一类由数据仓库(或数据集市)、查询报表、数据分析、数据挖掘、数据备份和恢复等部分组成的,以帮助企业决策为目的的技术及其应用。Gartner公司的Howard Dressner把商业智能定义成为把数据转化成信息,并通过迭代发现(Iterative Discoveries)把信息转化成商业上可用的知识。

在我们看来,商业智能就是能够从(海量)业务和相关数据中提取有用的信息,把信息转化成知识,然后根据这些知识来采用正确的商务行为的工具(参见图1-18)。在本书的范畴内,我们提到的BI(商业智能)工具都是指建立在数据分析和数据挖掘基础上的工具。

图1-18 商业智能示意图

现在基于海量数据的数据分析和数据挖掘技术在商业应用中已经相当广泛,因为对数据挖掘技术进行支持的三种基础技术已经发展成熟,这三种基础技术是:

· 海量数据收集和存储技术。

· 强大的计算机集群和分布式计算技术。

· 数据挖掘算法。

商业数据库现在正在以一个空前的速度增长,并且数据仓库正在广泛地应用于各种行业;对计算机硬件性能越来越高的要求,也可以用现在已经成熟的并行处理技术来满足;另外数据挖掘算法经过了这十多年的发展也已经成为一种成熟、稳定,且易于理解和操作的技术。

现在面临一个尴尬的境地——数据丰富,信息匮乏(Data Rich, Information Poor)。快速增长的数据,已经远远地超过了人们的直观理解能力,如果不借助强有力的工具,很难弄清大堆数据中所蕴涵的知识。结果,重要决策只是基于制定决策者的个人经验,而不是基于信息丰富的数据。数据挖掘就这样应运而生,数据挖掘填补了数据和信息之间的鸿沟。麻省理工学院的Erik Brynjolfsson教授曾经说过:有数据支持的(商业)决定总是更好的决定。

数据在商业运营上要能起到作用,我们必须要做到:

· 理解数据的上下文,明白数据到底支持商业运营的什么过程。

· 简化过程,使得数据更加便于管理。

· 在不同的渠道、应用和设备上整合数据。

· 丰富、匹配和清理数据,提高数据质量。

· 充分利用数据,比如整合关于消费者、市场和机会的数据。

· 选择合适的存储介质,比如私有云、公有云,还是专门设计的云存储。

· 获取最终结果数据并在各种终端上用可视化方式展示(包括移动终端)。

在最开始制定商业智能数据战略时,考虑的不应该是技术,而是从商业角度出发,看到底需要完成怎么样的商业目标,再回过头制定数据分析和数据挖掘过程。

当我们构建了完整的商业智能系统之后,可以通过图1-19的流程来定期对不同的环节做数据分析。

图1-19 商业智能分析示意图

我们对图1-15的商业智能分析中的各个阶段做个简单的解释。

· 看趋势:即观察KPI关键数据的日、周、月、季度、年的图表曲线趋势。KPI数据是上升了还是下降了;关联的其他相关KPI曲线,是否呈现了应该有的关联性;环比、同比的百分比如何等。在6.5 节中我们会详细介绍KPI的制定。

· 寻找变异:即找到单一KPI数据中的异常值,或者关联数据中非关联的异常部分。

· 分析原因:当我们找到了异常值,就需要分析造成这一异常的原因。看异常发生的时间节点,看内部的和外部的关联活动,看问题发生原因的构成,并把原因分解成独立的元素一一列出,标出权重,哪些是相对影响较大的,哪些又是可能的原因等。

· 制定对策:在正确地分析了相关原因后,就需要给出解决方法和策略。一般来说,一个原因对应一个解决策略;当然也可能有多个解决策略对应于同一个原因。我们选择最切合实际、最可执行的对策和行动策略。

以数据为基础的电子商务运营,不是一下子就能够成功的,而且是一个永远不停在变化的过程,不是做了一次优化就能够一劳永逸的。我们根据当前的来源分析和访客分析得出客户兴趣点和热门商品对整个网站做了调整,在经过了一段时间之后,客户的整体兴趣点一定会发生变化,而热门商品也会发生迁移,而这个时间点可能是相当短的。

正如本书一直强调的那样,任何的数据分析和数据挖掘都起始于对业务的理解,只有找出需要解决的具体商业问题,我们才能开始考虑用什么方式来分析挖掘。在本书后面的内容中,我们就可以帮助电商朋友很轻松地回答类似这样的问题:

· 我们的客户主要来自什么地区?

· 我们最应该重点推荐哪些商品?

· 我们最需要重点关注哪些客户?