2016 - 2024

感恩一路有你

cross validation 用哪个模型 xgboost中哪些特征可以归一化?

浏览量:5003 时间:2023-04-02 20:17:12 作者:采采

xgboost中哪些特征可以归一化?

短语参数的命名规则。现在xgboost s模块。在这个模块中,命名规则与skl:基本上用的是gbtr:多线程,如果没有设置,算自动检查并行计算的核心数量。

2.助推器参数

η(学习rat:学习率0.01-0.2。

min_chil:子节点的最低权重和。防止高的时候过贴,低的时候容易欠贴。

Max_d:损失阈值,当损失降低超过该阈值时,分割将继续。

最大增量步长:在最大增量步长中,我们允许每个树的权重估计为。

在subsampl:,当构建0.5-1中的每棵树时,为了避免过拟合,只取一部分样本进行构建。

col sampl:[0.5-1]特征采样

Colsampl: L2正则化$ T: L1正则项

秤_位置_重量

3.训练参数

客观二分类使用binary:logistic多分类使用multi:softmax直接返回标签,也可以使用multi:softbob或predict_prob训练后输出类别的概率。

Eval_metric:用它来评估。估计验证数据:RMSE,平均误差,对数损失,误差,对数损失,auc。

4.XGBoost允许在每次boosting迭代中使用交叉验证。因此,可以方便地获得最佳的升压迭代次数。而如果用sklearn的kfold和cross_val_score,这就是每个模型训练只用一个固定数据,而不是每轮boosting都要交叉校验。

5.关于特色工程

XGBOOST是树的增强模型。由于树的非线性特征,我们不 不需要标准化(正态分布)或缩放(到01区间)特征。

或者拿log(这个存疑,我个人觉得拿log可能有用?),但我们应该关注的是创造特色。

比如过去五天的平均值,去年同期的数值,环比增加,同比增长。比如租房的场景,房租/卧室数量这些和业务非常相关的东西,其实是需要不断摸索才能找到的。XGBOOST can 不能帮助我们获得这些特性。

与深度学习相比,深度学习本质上依赖于特殊的结构,如LSTM和CNN,来获得适合于这项业务的特征。

那么分类功能在XGBOOST中并不是特别有用,如果相关性不是很大可以去掉。如果类别不多,比如只有个位数的类别,可以添加。如果类别很多,可以考虑使用CATBOOSTING或者LIGHTGBM。

采购员的岗位职责,英文版?

R:

进行战略性采购

-协助团队领导建立采购预算、商品策略和运营计划。

-研究采购营销,推荐新的潜在供应商支持买家

本地化协调

-负责本地化开发,并针对项目指导提供跨职能支持

-与采购/SDE/采购团队合作跟踪所有开发零件的过程,包括所有验证阶段

-与内部部门合作,协调和推进新的本地化流程

-本地化FAI跟踪列表,推动新的本地化流程

产品视图计算(面向项目)

-定期创建MLL零件清单,并用Fico数据更新采购价格

特征 采购 参数

版权声明:本文内容由互联网用户自发贡献,本站不承担相关法律责任.如有侵权/违法内容,本站将立刻删除。