基础编程入门教程 如何用Weka将英文文本数据集转化成ARFF格式?
浏览量:1876
时间:2021-04-01 04:22:06
作者:admin
如何用Weka将英文文本数据集转化成ARFF格式?
第一步是建立一个中文数据集。第二步是将数据集准备成Weka可以处理的结构。这是一件好事。只需压缩数据集,因为所需的格式是将一类文件放在一个文件夹中。但还有一个问题。您的计算机通常没有足够的内存来处理此数据集。您可以选择几个类别,并在每个类别中放置几十个文档。第三步是分词。第四步是使用wekawiki中的示例将数据集转换为ARFF格式。Weka是一套机器学习算法,可用于分类、预测等。由于Weka支持的数据格式是ARFF或CSV,因此在进行Weka实验时必须对数据进行预处理。通常,我们可以在Excel中导入TXT,然后将其保存为.CSV文件(这种格式Weka也是可识别的),然后打开。在Weka、tool、arffviewer中创建CSV文件,并将其另存为。阿芙!
版权声明:本文内容由互联网用户自发贡献,本站不承担相关法律责任.如有侵权/违法内容,本站将立刻删除。
上一篇
什么是网站的功能设计 网页的设计
下一篇
网站企业动态 全国企业查询网站