kmeans输出聚类结果 K-means的算法优点?
K-means的算法优点?
K-means聚类算法的优点如下:1。算法简单快速。对于大数据集具有较高的效率和可扩展性。时间复杂度近似线性,适合于挖掘大型数据集。K-means聚类算法的时间复杂度为O(NKT),其中n表示数据集中的对象个数,T表示迭代次数,K表示聚类个数。
k均值聚类公式?
西格玛=[1,0 0,1
]mu1=[1,-1
]x1=mvnrnd(mu1,西格玛,200)
mu2=[5.5,-4.5
]x2=mvnrnd(mu2,西格玛,200)
mu3=[1,4
]x3=mvnrnd(mu3,西格玛,200)
mu4=[6,4.5
]x4=mvnrnd(mu4,西格玛,200)
mu5=[9,0.0
]x5=mvnrnd(mu5,西格玛,200)
%获取要聚集的1000个数据点
X=[x1 x2 x3 x4 x5
]%显示数据点
绘图(x1(:,1),x1(:,2),“r.”)按住
绘图(x2(:,1),x2(:,2),“b.”)
绘图(x3(:,1),x3(:,2),“k.”)
绘图(x4(:,1),x4(:,2),“g.”)
绘图(x5(:,1),x5(:,2),“m.”)
保存myX%存储X在文件中加载到其他文件中
因为聚类算法会在开始时随机设置聚类中心,然后迭代直到分类成功,所以样本的输入顺序会影响聚类算法初始聚类中心的选择,进而影响整个聚类算法模型。
该算法的原理如下:
选择k个类别
随机初始化k个聚类中心
计算每个数据点到中心点的距离,哪个数据集的中心接近哪个数据集的中心
计算每个聚类中心作为一个新的聚类中心
重复上述步骤,直到每个聚类中心聚类中心在每次迭代后变化很小或几乎没有变化
这个问题实际上是没有问题的分类效果和算法的实际运行时间因数据的不同而不同。在计算速度方面,K-means比hierarchy快。其原因是K-means算法是先找到中心,然后计算距离;层次是将样本逐个合并,层次算法的复杂度较高。更重要的是,在很多情况下,K-means算法和层次聚类算法的分类效果只能用不同的观点来描述。
kmeans输出聚类结果 kmeans聚类算法原理 kmeans聚类算法代码
版权声明:本文内容由互联网用户自发贡献,本站不承担相关法律责任.如有侵权/违法内容,本站将立刻删除。