
上QQ阅读APP看书,第一时间看更新
第6章 高斯混合聚类算法
GMM(高斯混合聚类)是一种常见的聚类算法,和K-Means算法很像,但GMM算法是通过训练获得类别的成分概率密度函数而非直接是类别,简单地说,K-Means算法的结果是每个数据点被assign到其中某一个 cluster,而GMM则给出这些数据点被assign到每个cluster的概率,所以比较K-Means算法,这种分类方式又称作soft assignment。
每个GMM由K个Gaussian分布组成,每个Gaussian称为一个Component,这些Component线性加成在一起就组成了GMM的概率密度函数。假定样本数据是由GMM生成出来的,那么只要根据数据推出GMM的概率分布就可以了,然后GMM的K个Component实际上就对应了K个cluster。这就是GMM的聚类原理。
本章将详细介绍GMM算法的数学流程,并详细推导了GMM算法各个参数的迭代过程,然后对GMM算法与K-Means算法进行了对比,最后给出测试代码。