1.2 数据分析师的理论知识
数据分析师需要掌握两方面的理论知识内容,一是数学统计知识,二是市场研究知识。
要想在数据分析的道路上走得更远,一定要注重对数学统计知识的学习。数据分析说到底就是寻找数据背后的规律,而寻找规律就需要具备一定的算法设计能力,所以数学统计知识对数据分析是非常重要的。
数据分析师进行数据分析是为了企业在市场上能更好地占据主动地位,而且数据分析师除了分析数据,还要为发现的问题提供解决方案,解决方案往往从数据分析师的市场思维中产生。因此数据分析师也需要掌握一定的市场分析知识。
1.2.1 数学统计知识
在信息爆炸式增长的时代,简单利用经验对数据进行判断往往会出现较大偏差,而利用数学统计学的各种方法来对数据进行分析、加工、整理,不仅能有效提升数据分析效率,同时还能从复杂的数据信息中提取出有效内容,并将其更好地应用于企业的经营与管理中。数据分析中最常利用以下七种数学统计知识。
1. 集中趋势
集中趋势是一组数据的代表值,就整体数据而言,平均数反映了总体分布的集中趋势,根据某组数据的平均数,就可以大致了解它总体的集中趋势和一般特征。集中趋势是数据统计的重要分析指标,常用的方法有求平均数、中位数和众数等。
2. 变异性量数
描述统计和数据分布特征,变异性量数或离散量数,是重要的一部分。变异性量数可看作对不同数值之间差异性的测量。变异性量数用来描述数据分布的特征,并能表示数据分布的差异,常用的方法有极差、标准差、方差等。
3. 归一化
归一化处理是简化计算、缩小量值的有效办法。处理后的所有特征的值都会被压缩到0到1的区间上。这样做还可以抑制离群值对结果的影响。
4. 正态分布
数据都会呈现一种中间密集、两边稀疏,如图1-2所示的特征。例如,年龄相仿的人身高数据是符合正态分布的,也就是说大部分同龄人的身高都会在平均身高上下波动,特别矮和特别高的都比较少。
图1-2 正态分布示意图
5. 抽样分布
抽样分布是样本估计量的分布。以样本平均数为例,假如设置相同的样本容量,用同样的抽样方式抽取多次样本,并把每次抽样结果取平均数。由样本平均数组成的分布样式,就是样本平均数的抽样分布。
6. 参数估计
数据分析师常常需要根据手中有限的数据,去推测数据中透露出的本质规律。参数估计就是工具之一,参数估计是根据从整体中抽取的随机样本去估计总体分布中未知参数的过程,即根据部分样本数据去推断总体的分布或数字特征。
7. 假设检验
假设检验是某种带有概率性质的反证法。当样本与总体情况出现差异的时候,可以利用假设检验法判断是数据统计出现误差还是本质出现差错。假设检验中最常用的方法是显著性检验法,这是一种非常基本的统计推断形式。
通过对数学统计知识的应用,能够最大限度地分析出数据中蕴含的价值,并进一步通过市场研究知识实现数据信息与企业运营的深度融合,为企业创造效益。
1.2.2 市场研究知识
市场研究知识可以从市场行业角度去分析产品和竞品在行业中的位置,为营销及活动提供数据支撑。
1. 行业背景
制定企业宏观战略的第一步是考察行业背景,例如,当今移动互联网产业正处于风口,有国家的政策支持,技术也在飞速发展中;煤炭、钢铁等传统产业产能过剩,发展滞缓。企业经营本质是利益的追逐,因此趋利避害是企业经营的天性。PEST分析法是企业在做市场背景调研时利用较多的一种分析方法。对于外部分析的相关内容,PEST分析法能给予企业在某种环境下的一些外部信息数据。
这种方法是利用环境扫描分析总体环境中的政治(Political)、经济(Economic)、社会(Social)与科技(Technological)四种因素的一种模型(见图1-3)。
图1-3 PEST分析法
通过这种方法也能有效地了解市场的发展进程、企业现在处在什么样的市场环境之中,有利于企业的环境要及时把握,市场环境带来的弊端要尽量避开,PEST分析法的利用对企业生存和发展起着至关重要的作用。
2. 市场现状
市场是社会分工和商品生产发展的产物,哪里有社会分工和商品交换,哪里就有市场。市场在发展壮大的过程中,也不断地通过信息反馈现状。数据分析师必须敏锐感察觉市场变化,依据变化不断调整企业发展政策,使企业发展能更上一层楼。
(1)市场阶段主要包括以下四个阶段。
导入阶段:行业刚开始发展,面对未知的领域和商业模式,数据分析师需要通过对消费者购买心理行为的调查分析,预估市场未来前景,制定产品企划策略。
发展阶段:行业已经发展了一段时间,处于向上发展阶段,如现在的共享充电宝行业,竞争对手云集,呈现百家争鸣的状态。数据分析师需要通过对行业内成功的商业模式进行分析提炼,取其精华,去其糟粕,推动企业获得大量市场。
成熟阶段:行业的头部企业已经基本固定。以外卖软件为例,美团与饿了么成为行业寡头,占领了九成以上市场,市场处于成熟阶段,且企业拥有健全的商业模式。数据分析师需要通过对企业拥有的用户数据进行分析建模,判断用户新需求,在原有商业模式的基础上不断创新,满足用户需求。
衰退阶段:受经济政策、市场发展等多方因素影响,市场走下坡路。数据分析师应帮助企业规避处于衰退阶段的市场。例如,受到经济政策环境的影响,煤炭行业整体处于衰退阶段。数据分析师应通过对原有市场数据进行分析整理,发掘新兴发展点,推动企业尽快转型。
对市场阶段的把握直接影响企业产品策略制定和营销策略制定,数据分析师必须认真研究和运用市场阶段理论,结合当下市场数据,做出推断并推动企业政策的制定与调整。
(2)市场规模也被称作市场容量,市场规模主要是研究目标产品或行业的整体规模,包括产品在指定时间内的产量、产值等,具体还要根据人口数量、人们的需求、年龄分布、地区的贫富程度调查所得的结果。
数据分析师需要对产品用户数、产品付费人数、支出款项数等进行整理分析,同时可以利用竞品之间的横向数据进行分析对比,体现出不同的市场态势。
3. 微观个体
对企业来说,对微观客体即用户进行研究是非常重要的。没有详细严谨的客户研究,就不会有成功的产品。用户研究伴随着一个企业发展的始终,是帮助数据分析师认知用户的一种方法。对用户进行研究能更好地指导企业设计产品、优化产品。数据分析师需要根据数据把握用户需求,使产品不断优化,更好地迎合客户的需求。
4. 商业模式
环顾全球范围内的大数据发展趋势和生态模式,一些企业对数据的应用已经取得了丰硕的成果。一些互联网企业,如阿里巴巴、谷歌、腾讯等,它们成功的秘诀都是创新商业模式,而商业创新主要依靠充分运用数据分析的力量。
对数据分析师来说,扎实的市场研究知识和敏锐的分析能力都是必要的,数据时代开放性、网络化的数据无处不在,数据分析必须与市场知识默契融合,才能为企业带来效益。