2016 - 2024

感恩一路有你

kmeans算法基本步骤 k-means聚类算法为什么会受到样本输入顺序的影响?

浏览量:1823 时间:2021-03-15 09:08:47 作者:admin

k-means聚类算法为什么会受到样本输入顺序的影响?

因为聚类算法会在一开始就随机设置聚类中心,然后迭代直到分类成功,所以样本的输入顺序会影响聚类算法初始聚类中心的选择,进而影响整个聚类算法模型。

算法原理一般如下:

选择k个类别

随机初始化k个聚类中心

计算每个数据点到中心点的距离,数据集的哪个中心靠近哪个聚类

将每个聚类中心计算为一个新的聚类中心

重复上述步骤,直到每个聚类中心在每次迭代后变化很小或几乎没有变化

K均值聚类算法的优缺点主要有以下几点:

1。算法简单快速

2。它对于大数据集具有很高的效率和可扩展性

3。时间复杂度近似线性,适合于挖掘大型数据集。K-means聚类算法的时间复杂度为O(NKT),其中n表示数据集中的对象个数,T表示迭代次数,K表示聚类个数。

kmeans算法基本步骤 kmeans算法原理和步骤 kmeans聚类算法代码

版权声明:本文内容由互联网用户自发贡献,本站不承担相关法律责任.如有侵权/违法内容,本站将立刻删除。