前言
本书第1版自2015年2月出版后,在市场上获得了强烈的反响,当月在当当网的新书热卖榜中排名第二,半年内销售近万册,至2016年1月已经印刷了5次,共发行近两万册,图书被收录进百度百科。
如此巨大的市场销量和好评,引起笔者的深思,除本书构思巧妙、内容翔实、文法流畅等主观因素外,宏观的市场环境也是不容忽视的。2015年,中国经济由原来的爆发式增长进入到略显低迷的新常态,无论是企业还是商家都感受到了压力,钱不再像以前那样好赚了。如何实现经济增长,如何让企业存活下去,这就需要深挖企业内部的痛点和洞察外部客户的特点。深挖和洞察的过程就是数据分析的过程,数据分析时代在中国悄然到来了。
随着数据分析师的价值凸显,有越来越多先知先觉的人们纷纷转行加入到数据分析师的大军中。而统计学是数据分析师们必修的课程之一,“从零进阶!数据分析的统计基础”的本意就是让更多的人能从零基础快速进阶到数据分析领域,并且重点讲述数据分析师们必须具备的概率和统计的关键知识点。而经管之家(原人大经济论坛)适时地推出本书,使其得到了很好的市场回馈。正所谓天时地利人和,造就了一本好书。
为了和市场的发展紧密结合,以及更好地适应读者的需求,本书进行了改版。本次改版继续坚持从零进阶,强化数据分析基础理论,和市场接轨等核心理念,继续使用“三国武将”这个大家都耳熟能详的业务背景知识。根据学员的需求和市场的实际情况,作者还对本书内容进行了如下调整。
(1)进一步精练数据分析的理论基础,去除了一些不必要的数学公式。由于数据分析涉及概率论、微积分、数理统计的很多内容,但有些内容又不用全部学会,这让初学者很难找出哪些是需要学习的内容,哪些是不需要学习的内容。因此在编写本书第1版时,将很多数据分析师不需要知道的知识点都省略了,比如省略了统计量服从某个分布的证明过程,省略了抽样平均误差的证明过程。这样做的目的是为了让数据分析师们能更快地进入这个领域,更好地洞察数据。在编写本书的第2版时,继续沿用此思想,去掉了一些数据分析师不必要知道的公式,增加了更多的数据分析思想的内容。
(2)将原来的第3章抽样估计分解成数理统计基础和抽样估计两章,这样做的目的是考虑到原来的第3章涉及的理论内容太多,并且比较枯燥,将其分成两部分,一来可以在每一部分增加更多的公式解读内容,也可以补充更多的案例进来;二来降低了阅读难度,使读者能在学习知识的同时,获得更多的成就感,从而更加有兴趣学习。
(3)对试验数据进行了更多的数据分析,增加了对读者数据分析思维的培养。尤其是第2章的描述性数据分析过程,进行了更深入的数据分析过程剖析,主要宗旨在于让读者更快地进入到数据分析行业的队伍中来。当然,这也使得第2版中的三国武将数据和第1版中的数据存在一些差异。
当然,仅就本书而言,读者并不会学到数据分析师所需要的全部知识,这需要几年的循序渐进学习,但我希望读者看过本书后,能快速具有数据分析师所需要的最基本的统计学知识,能快速地进入到数据分析的行业,从而具备一个数据分析师应具备的最起码的知识,在工作中能说内行话,而不是说行外话。
在本书改版之际,作者衷心感谢经管之家(原人大经济论坛)和CDA课程研发团队多年来始终不渝的关心与鼎力支持,感谢关继杰,感谢广大读者给予我的理解与感受,感谢电子工业出版社多年来的密切合作与支持。没有这一切,本书不可能取得这么好的成果,我永远感谢曾经帮助和支持过我的相识的和不相识的同志和朋友。由于作者水平有限,本书肯定会有不少缺点和不足,热切期望得到专家和读者的批评指正。
曹正凤
2016年3月于北京