机器学习算法本质上是一种发现规律或解决问题的工具和方法,而其研究的对象就是数据或特征化的数据。在大数据时代,数据爆炸提供了博大的数据海洋,如何筛选对我们研究问题有用的数据是研究的第一步,而特征工程是专门针对这个问题的领域。作为迈入机器学习的第一步,本篇介绍了几种常见特征处理算法的理论知识和具体应用。