2016 - 2024

感恩一路有你

k均值聚类算法例题 k均值聚类算法原理?

浏览量:1280 时间:2021-03-14 08:28:59 作者:admin

k均值聚类算法原理?

第1步:选择k个初始聚类中心,Z1(1)、Z2(1)、ZK(1),其中括号中的序列号是找到聚类中心的迭代操作的第二序列号。聚类中心的向量值可以任意设置。例如,可以选择初始K个模式样本的向量值作为初始聚类中心。

第二步是根据最小距离准则将模式样本{x}分配给K个聚类中心之一。

假设I=J,则K为迭代运算的次序列号,第一次迭代K=1,SJ为第J个簇,其簇中心为ZJ。

第3步:计算每个聚类中心的新向量值ZJ(k1),j=1,2,K

找到每个聚类域中样本的平均向量:

其中NJ是第j个聚类域中的样本数SJ。以均值向量作为新的聚类中心,可以最小化以下聚类准则函数:

在这一步中,我们需要分别计算K个聚类的样本均值向量,因此称为K-means算法。

第4步:如果J=1,2,K,则返回第二步,逐个重新分类模式样本,并重复迭代操作;

如果J=1,2,则算法收敛,计算结束。

K-means的算法优点?

K-means聚类算法的优点如下:1。算法简单快速。对于大数据集具有较高的效率和可扩展性。时间复杂度近似线性,适合于挖掘大型数据集。K-means聚类算法的时间复杂度为O(NKT),其中n表示数据集中的对象个数,T表示迭代次数,K表示聚类个数。

在大数据量时,K-means算法和层次聚类算法谁更有优势?

事实上,这个问题没有解决办法。该算法的分类效果和实际运行时间因数据的不同而不同。在计算速度方面,K-means比hierarchy快。其原因是K-means算法是先找到中心,然后计算距离;层次是将样本逐个合并,层次算法的复杂度较高。更重要的是,在很多情况下,K-means算法和层次聚类算法的分类效果只能用不同的观点来描述。

k均值聚类算法例题 k均值聚类算法优缺点 k均值聚类分析例题

版权声明:本文内容由互联网用户自发贡献,本站不承担相关法律责任.如有侵权/违法内容,本站将立刻删除。