文本分类朴素贝叶斯算法 为什么朴素贝叶斯称为“朴素”?请简述朴素贝叶斯分类的主要思想?
浏览量:1771
时间:2021-03-15 12:52:56
作者:admin
为什么朴素贝叶斯称为“朴素”?请简述朴素贝叶斯分类的主要思想?
朴素贝叶斯分类器是一种基于贝叶斯独立假设定理的简单概率分类器。
Naive的直译意思是简单、简单和天真。
朴素贝叶斯分类是最常用的两种分类算法(决策树分类和朴素贝叶斯分类)。分类是将一个未知样本分成几个已知类的过程。
朴素贝叶斯分类基于贝叶斯概率的思想,假设属性相互独立,如a和B,则p(B | a)表示a发生时B的概率。
详见刘伟鹏大牛著《数学之美:平凡而神奇的贝叶斯方法
文本分类算法主要包括朴素贝叶斯分类算法、支持向量机分类算法、KNN算法和决策树算法。
朴素贝叶斯分类算法主要利用文本中特征项和词的类别的组合概率来估计文本属于哪个类别的概率。
支持向量机(SVM)主要利用特征提取技术将文本信息转化为词向量,然后计算词向量与训练类数据的相似度。
KNN算法是在训练集中找到最近的K个文本,并根据这些文本的分类来预测要分类的文本属于哪个类别。
决策树算法是在树的基础上建立预测模型,根据预测模型对文本进行分类预测。
文本分类朴素贝叶斯算法 python朴素贝叶斯的文本分类 基于朴素贝叶斯的文本分类
版权声明:本文内容由互联网用户自发贡献,本站不承担相关法律责任.如有侵权/违法内容,本站将立刻删除。