统计挖掘与机器学习:大数据预测建模和分析技术(原书第3版)
上QQ阅读APP看书,第一时间看更新

7.9 本章小结

我把经典数据减少技术PCA重新定位为EDA的重新表述方法,然后将其称作下一种时髦的数据挖掘工具。我把PCA描述成一个能够用于一般应用,而且能够从中获得预期结果的统计数据挖掘方法。我们用EDUCATION(教育)普查变量的一个示例做了具体说明。然后,我介绍了一个PCA不常用的应用——为将一个类别预测变量纳入模型寻找一个结构化方法。这些结果非常有说服力,因为它们凸显了PCA在数据挖掘方面的力量。而且,我还提供了一个首创的有价值的PCA用法,用于构造准交互变量,同时提供了相应的SAS程序代码。