2016 - 2024

感恩一路有你

python实现kmeans聚类 在Python中聚类后,如何知道哪个样本属于哪一类?

浏览量:2306 时间:2021-03-15 08:07:39 作者:admin

在Python中聚类后,如何知道哪个样本属于哪一类?

首先可以看到聚类后的样本

如果使用Python sklearn中的K-means聚类算法,算法类本身就有一些属性可以知道聚类后的情况。

例如,有一些模型属性,clusterucentersuuuuuux是聚类后得到的聚类中心,标签uuux如上图所示,样本[1.4,0.2]对应第三个类别,聚类结果还有每个类别的聚类中心和每个类别的样本数。这种方法可以用来寻找相应的标签分类。

当然,还有一个predict方法,可以直接输出输入样本的类标签

~]?算法:

第1步:选择k个初始聚类中心,Z1(1)、Z2(1)、ZK(1),其中括号内的序列号是寻找聚类中心的迭代操作的次序列号。聚类中心的向量值可以任意设置。例如,可以选择初始K个模式样本的向量值作为初始聚类中心。

第二步是根据最小距离准则将模式样本{x}分配给K个聚类中心之一。

假设I=J,则K为迭代运算的次序列号,第一次迭代K=1,SJ为第J个簇,其簇中心为ZJ。

第3步:计算每个聚类中心的新向量值ZJ(k1),j=1,2,K

找到每个聚类域中样本的平均向量:

其中NJ是第j个聚类域中的样本数SJ。以均值向量作为新的聚类中心,可以最小化以下聚类准则函数:

在这一步中,我们需要分别计算K个聚类的样本均值向量,因此称为K-means算法。

第4步:如果J=1,2,K,则返回第二步,逐个重新分类模式样本,并重复迭代操作;

如果J=1,2,则算法收敛,计算结束。

python实现kmeans聚类 python kmeans聚类 聚类算法python有意思的算例

版权声明:本文内容由互联网用户自发贡献,本站不承担相关法律责任.如有侵权/违法内容,本站将立刻删除。