2016 - 2024

感恩一路有你

kmeans聚类分析实例 文本聚类算法真正能实用的有哪些算法?

浏览量:2641 时间:2021-03-19 17:47:42 作者:admin

文本聚类算法真正能实用的有哪些算法?

在文本信息空间中,我们可以找到任意两个最相关的文本信息,并将它们缩减为一个文本信息,从而达到信息量的缩减。

简并算法的实现比较整个信息空间中所有文本的相关性(熟人),得到它们之间的相关性,然后进行配对。配对的要求是两个文本信息最相关。例如,如果a找到文档B,那么B也必须找到最相关的文档,即a。注意:在某些情况下,a的最近文档是C,那么B和B的最相关文档也是C。存在a、B和C自一致的情况,即形成最近空间信息的三角形。

在获得最相似的文档后,我们将仅对它们进行平均或简单地添加它们。

信息空间中独立信息的数量将减少到原来的一半以下,然后在合并过程中重复实现1的过程。

最后,信息被缩减为唯一信息,即整个信息文本的平均值。

绘制信息树的结构,可以根据簇的大小自动聚类。

kmeans聚类分析实例 基于word2vec文本聚类 文本聚类分析工具

版权声明:本文内容由互联网用户自发贡献,本站不承担相关法律责任.如有侵权/违法内容,本站将立刻删除。