前言
本书是统计学的入门书,为大家介绍用 Python 实现的分析方法,主要内容为以下 3 点。
- 如何分析数据?
- 使用某种方法为什么会更好?
- 如何用 Python 进行分析?
本书将花费大量篇幅讲解统计学的基础知识,尽量避免介绍对初学者意义不大的经验技巧。
书中也会介绍如何用 Python 进行统计分析。
Python 的语法比较简单,可以通过简短的代码实现复杂的分析。另外,Python 也非常适合用于机器学习。因此,通过用 Python 学统计学,将有助于从统计学基础到机器学习的过渡。
统计学往往被认为很难学,其原因有很多:不理解术语、不懂公式、比喻表达难理解等。为了避免这些问题,本书将从文字说明、公式和 Python 代码 3 个维度来讲解相同的内容,以帮助读者加深理解。
统计学的一大难点就是需要理解很多概念,还要理解各概念之间的联系。本书在写作过程中尽可能地将这些概念串联在一起,目录也十分详尽,读者可以直观地把握自己的学习进度。
另外,本书还将介绍一些比较新兴的内容,以使读者不仅掌握用于描述数据的分析方法,还能掌握用于预测数据的分析方法。本书的一个目标是让读者了解统计学的全貌,为此,在个别地方可能表达不够严谨。书中适当地给出了参考文献,并在最后给出了建议读者继续深入阅读的书目,因此,本书也起到了桥梁的作用,希望读者在读完本书之后,能够更顺畅地阅读难度更高的文献。
第 1 章和第 2 章将分别介绍统计学和 Python 的基础知识。
第 3 章将介绍如何用 Python 进行统计分析,主要内容有参数估计和假设检验等统计学入门知识。读者可结合 Python 实现来学习。本章还将介绍分析结果的描述方式等非常实用的内容,以供在实验和研究中使用假设检验的读者参考。
第 4~6 章将介绍统计模型及使用统计学进行预测的方法。第 4 章介绍统计模型的基础,第 5 章介绍正态线性模型,第 6 章介绍对正太线性模型进行了扩展的广义线性模型。
第 7 章将介绍统计学和机器学习的关系。机器学习具有比统计模型更强的“预测”能力。在介绍统计学和机器学习的关系之后,还将介绍正则化和神经网络。
本书是从统计学的基础知识讲起的,所以读者可以从头开始学习统计预测的方法。只要理解了什么是统计预测,什么是好的预测,就能够摆脱“只会调用机器学习库”的困境。
统计学是方便的工具,讲解统计学的图书也应该是方便的工具。
希望本书能够成为你的得力助手。
致谢
感谢本书编辑绿川老师自策划阶段给予的诸多关照,没有他就没有本书的问世,在此深表谢意。