python如何在绘图并添加文字 如何计算随机森林中的,变量重要性?
浏览量:2892
时间:2021-03-14 21:49:24
作者:admin
如何计算随机森林中的,变量重要性?
首先,对于每一棵树,每次都用bootstrap方法提取样本进行训练,但是有1/3的数据没有提取出来,所以称为out-of-bag data(OOB),将OOB引入决策树,计算误差error1。对OOB中所有样本的特征X对应的值进行噪声干扰,即随机改变特征值,然后将数据引入决策树,计算误差2。
对于n个树,变量x的重要性计算为error2-error1的平均值
adaboost随机森林什么关系?
随机林将对变量进行子采样,例如,变量为p。随机林每次将随机选择log p变量来拟合决策树。显然,随机森林适合于大磷比的情况。否则,logp可能为1.2。这种情况毫无意义。AdaBoost与gbdt非常相似,可以理解前者是后者的特例。适合p相对较小时使用。当然,这两种方法都只适用于N>>P情形,即样本携带足够的信息来拟合非线性关系。也就是说,随机森林不适合于P特别大的情况,如果P>>N,则以Lasso为首的惩罚回归为首选工具。
python如何在绘图并添加文字 随机森林特征重要性计算 随机森林对特征重要性排序
版权声明:本文内容由互联网用户自发贡献,本站不承担相关法律责任.如有侵权/违法内容,本站将立刻删除。