对比Excel,轻松学习Python数据分析(入职数据分析师系列)
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

序言

有幸收到张俊红的做序邀请,我非常高兴。

从PC时代到移动互联网时代一路走来,每个人都感受到了数据爆炸性的增长,以及其中蕴含的巨大价值。

从PC时代开始,我们用键盘、扫描仪等设备使信息数据化。在移动互联网时代,智能手机通过摄像头、GPS、陀螺仪等各种传感器将我们的位置、行动轨迹、行为偏好,甚至情绪等信息数据化。截至2000年,全人类存储了大约12EB的数据,要知道1PB=1024TB,而1EB=1024PB。但是到了2011年,一年所产生的数据就高达1.82ZB (注:1ZB=1024EB),数据已经变成了一种人造的“新能源”。

在商业领域,从信息到商品,从商品到服务,越来越多我们熟悉的事物被标准的数据所度量。无论是在线广告的精准营销,还是电子商务的个性化推荐,又或者是互联网金融的人脸识别,互联网的每一次效率提升都依赖于对传统信息、物品,甚至人的数据化。

在使用数据进行效率变革及商业化的道路上,Excel和Python扮演了关键的角色,它们帮助数据分析师高效地从海量数据中发现问题,验证假设,搭建模型,预测未来。

作为一本数据分析的专业书籍,作者从数据采集、清洗、抽取,以及数据可视化等多个角度介绍了日常工作中数据分析的标准路径。通过对比Excel与Python在数据处理过程中的操作步骤,详细说明了Excel与Python间的差异,以及用Python进行数据分析的方法。

虽与作者素未谋面,但是对于Python在处理海量数据和建模上的高效性与便捷性,以及Python在机器学习中的重要性,我们的观点是一致的。同时我们也相信对于数据分析从业者来说,掌握一种用于数据处理的编程语言是非常必要的,而从 Excel 到Python的学习方法则是一条学好数据分析的“捷径”。

王彦平

(网名“蓝鲸”,电子书《从Excel到Python——数据分析进阶指南》《从Excel到R——数据分析进阶指南》《从Excel到SQL——数据分析进阶指南》的作者)

2019年1月8日