前言
Preface
大数据、人工智能以及5G时代的到来,使得每个人都可以随时随地产生大量的真实数据。这些数据中隐藏着巨大商机,能否通过快捷、有效的数据分析,找到对管理者判断、决策有价值的分析结果,决定着一个企业,甚至一个城市能否在发展中占得先机。可以说,未来人人都需要掌握一定的数据分析技能。
Python语言简单易学,做数据处理快捷、高效、容易上手。而且,Python的第三方扩展库一直在更新,因此未来其应用范围会越来越广。目前,Python在科学计算、数据分析、数学建模、数据挖掘等方面,占据着非常重要的地位。
本书将从零开始,详细讲解Python数据分析的相关知识。无论你有没有Python基础,通过本书你都能最终成为数据分析高手。
本书内容
本书提供了从Python入门到成为数据分析高手所必需的各项知识,共分4篇,大体结构如下图所示。
第1篇:基础篇。本篇首先介绍什么是数据分析,然后带领读者搭建Python数据分析环境,并介绍了五大开发环境,包括Python自带的IDLE、集成开发环境PyCharm、适合数据分析的标准环境Anaconda、Jupyter Notebook开发工具和Spyder开发工具。
第2篇:实践篇。本篇以数据分析三剑客Pandas、Matplotlib和Numpy为主线,以数据分析的基本流程展开讲解,详细介绍了Pandas数据处理与数据分析,数据可视化三大图表Matplotlib、Seaborn和第三方图表Pyecharts,图解数组计算模块NumPy。最后,通过8个典型的数据统计分析案例,对前面所学的知识进行综合应用,通过实际案例来检验学习成果。
第3篇:高级篇。本篇以机器学习库Scikit-Learn为主,介绍了什么是Scikit-Learn、线性模型、支持向量机和聚类。
第4篇:项目篇。本篇以项目实战为主,侧重提升读者的实际数据分析能力。涉及四大领域,主要包括APP注册用户分析(MySQL版)、电商销售数据分析与预测、二手房房价分析与预测,以及客户价值分析。
本书特点
主流技术,全面覆盖。本书内容丰富,涵盖了数据分析三剑客Pandas、Matplotlib和Numpy,数据可视化三大图表Matplotlib、Seaborn和Pyecharts,机器学习库Scikit-Learn等,一本书可以掌握数据分析领域的所有主流核心技术。
由浅入深,循序渐进。本书在介绍晦涩难懂的专业术语时,给出了大量示意图,并以现实生活中的场景为例讲解,力求轻松、有趣、易懂,扫除专业壁垒,帮助读者快速入门。
示例典型,轻松易学。通过例子学习是最好的学习方式,本书通过“一个知识点、一个例子、一个结果”的模式,透彻详尽地讲述了数据处理、数据分析、数据可视化、数组计算和机器学习的相关知识。另外,为了便于读者阅读程序代码,快速掌握Python数据分析技能,书中几乎每行代码都给出了注释。
应用实践,随时练习。书中提供了248个应用示例、20个综合案例,4个项目案例,同时提供了大量的样本数据,读者可以随时拿来操练,巩固和提升自己的数据处理和分析能力。
精彩栏目,贴心提醒。本书根据需要在各章使用了很多“注意”“说明”“知识胶囊”等小栏目,让读者可以在学习的过程中更轻松地理解相关知识点及概念,更快地掌握数据分析技能和应用技巧。
读者对象
自学编程的初学者
大中专院校的老师和学生
毕业设计的学生
与数据打交道的人员
刚踏入数据分析师门槛的人员
相关培训机构的老师和学员
初、中级程序开发人员
想掌握数据分析技能的职场人员
读者服务
本书附赠的各类学习资源,读者可登录清华大学出版社网站(www.tup.com.cn),在对应图书页面下获取其下载方式,也可扫描下方的“文泉云盘”二维码,获取其下载方式。
文泉云盘
获取本书资源
致读者
本书由明日科技Python开发团队组织编写。明日科技是一家专业从事软件开发、教育培训以及软件开发教育资源整合的高科技公司,其编写的教材非常注重选取软件开发中的必需、常用内容,同时也很注重内容的易学、方便性以及相关知识的拓展性,深受读者喜爱。其教材多次荣获“全行业优秀畅销品种”“全国高校出版社优秀畅销书”等奖项,多个品种长期位居同类图书销售排行榜的前列。
在编写本书的过程中,我们始终本着科学、严谨的态度,力求精益求精,但错误、疏漏之处在所难免,敬请广大读者批评指正。
感谢您购买本书,希望本书能成为您编程路上的领航者。
“零门槛”编程,一切皆有可能。
祝读书快乐!
编 者
2021年4月