java编程 文本聚类算法真正能实用的有哪些算法?
浏览量:1246
时间:2021-03-25 21:59:53
作者:admin
文本聚类算法真正能实用的有哪些算法?
在文本信息空间中,我们可以找到任意两个最相关的文本信息,并将它们缩减为一个文本信息,从而达到信息量的缩减。
简并算法的实现比较整个信息空间中所有文本的相关性(熟人),得到它们之间的相关性,然后进行配对。配对的要求是两个文本信息最相关。例如,如果a找到文档B,那么B也必须找到最相关的文档,即a。注意:在某些情况下,a的最近文档是C,那么B和B的最相关文档也是C。存在a、B和C自一致的情况,即形成最近空间信息的三角形。
平均或仅叠加后将获得最相似的文档。
信息空间中独立信息的数量将减少到原来的一半以下,然后在合并过程中重复实现1的过程。
最后,信息被缩减为唯一信息,即整个信息文本的平均值。
绘制信息树的结构,可以根据簇的大小自动聚类。
版权声明:本文内容由互联网用户自发贡献,本站不承担相关法律责任.如有侵权/违法内容,本站将立刻删除。