sklearn中决策树的建模流程 人工智能与机器学习的内涵及联系?
人工智能与机器学习的内涵及联系?
人工智能和机器学习之间的关系是什么?
-机器学习是利用实现程序人工智能的一种技术手段
-算法模型
-概念:普通的对象。特殊之处就取决于人该对象内部也板载显卡或是封装方法好一个某种方程(还是没有求出解的方程)
-作用:算法模型对象终于求出的解那就是该算法模型基于分析和预测的或分类的结果
-预测
-分类
-样本数据:numpy,DataFrame
-样本数据和算法模型之间的关联:样本数据是必须解出到算法模型对象中对其采取内部整体封装的方程接受求解的操作。该过程被称做模型的训练。
-组成部分:
-特征数据:自变量(楼层,采光率,面积)
-目标数据:因变量(售价)
-模型的分类:
-有监督去学习:假如模型必须的样本数据中必须包涵特征和目标数据,则该模型归为有监督学习的分类
-无监督学习:要是模型要的样本数据只要有特征数据再试一下。
-sklearn模块:至少封装方法了10多种算法模型对象。
-线性回归模型算法模型-》分析和预测
-KNN算法模型-》分类
分类和分析和预测的区别
-分类
分类:输入输入样本数据,输出来随机的类别,将样本中每个数据对应三个试求属性。(有监督学习)
分类算法分成三类两步:
(1)学习步:是从训练样本数据集,确立分类划分规则
(2)归类步:用试求的测试样本集评估分类规则的准确率,若准确率可接受,则是建议使用该规则对除样本以外的数据(待测样本集)并且分析和预测。
-分析预测
预测:两种或是两种以上的变量之间相互依赖的函数模型,进行预估或则操纵。
预测国家算法分两步:
(1)是从训练集组建样本模型
(2)检验后参与预测或是压制
-正确的分类与预测算法
1.回归分析:线形进入虚空、非线性重临、Logistic回归、岭轮回、主成分重临、最小二乘回归等。
2.决策树:分类算法
(人工神经网络):
4.贝叶斯网络
5、支持向量机(svm):将低维非线性转换的为高维线形进行计算。
关于sklearn中的决策树是否应该用one-hot编码?
sklearn中的决策树是CART,咱们都知道它是实现基尼指数的二叉树。这样的话相对于一个属性,并不会中,选择一个值对该属性划分成两部分。要是有一个离散化方法特征的取值有1000个,诸如商品的品牌,这样如果没有直接按顺序从0到999编号,有无会出问题?要知道CART会从0-999选不一个编号接受划分,但是这些编号的顺序却没意义,这个划分问题看样子也不现代科学。此时有无应该用独热编码?
不要,树模型不计算距离。
版权声明:本文内容由互联网用户自发贡献,本站不承担相关法律责任.如有侵权/违法内容,本站将立刻删除。