机器学习:软件工程方法与实现
上QQ阅读APP看书,第一时间看更新

第3章 实验数据准备

学习与研究机器学习是一个不断探索和实验的过程,我们在学习机器学习的过程中需要对五花八门的类数据集进行各类机器学习算法的相关实验。

之前也提到过机器学习作为一门交叉学科,涉及面广,涵盖高等数学、概率与统计、信息论、博弈论、最优化、算法、计算机科学和认知科学等多个分支领域。机器学习与传统统计密不可分,两者都是从数据中得出结论。所以本章将主要介绍常见的数据分布、常用开源数据集、实验数据集生成方法整理以及随机数据生成方法。