cross validation 用哪个模型 xgboost中哪些特征可以归一化？

浏览量：5003 时间：2023-04-02 20:17:12 作者：采采

xgboost中哪些特征可以归一化？

短语参数的命名规则。现在xgboost s模块。在这个模块中，命名规则与skl:基本上用的是gbtr:多线程，如果没有设置，算自动检查并行计算的核心数量。

2.助推器参数

η(学习rat:学习率0.01-0.2。

min_chil:子节点的最低权重和。防止高的时候过贴，低的时候容易欠贴。

Max_d:损失阈值，当损失降低超过该阈值时，分割将继续。

最大增量步长:在最大增量步长中，我们允许每个树的权重估计为。

在subsampl:，当构建0.5-1中的每棵树时，为了避免过拟合，只取一部分样本进行构建。

col sampl:[0.5-1]特征采样

Colsampl: L2正则化$ T: L1正则项

秤_位置_重量

3.训练参数

客观二分类使用binary:logistic多分类使用multi:softmax直接返回标签，也可以使用multi:softbob或predict_prob训练后输出类别的概率。

Eval_metric:用它来评估。估计验证数据:RMSE，平均误差，对数损失，误差，对数损失，auc。

4.XGBoost允许在每次boosting迭代中使用交叉验证。因此，可以方便地获得最佳的升压迭代次数。而如果用sklearn的kfold和cross_val_score，这就是每个模型训练只用一个固定数据，而不是每轮boosting都要交叉校验。

5.关于特色工程

XGBOOST是树的增强模型。由于树的非线性特征，我们不不需要标准化(正态分布)或缩放(到01区间)特征。

或者拿log(这个存疑，我个人觉得拿log可能有用？)，但我们应该关注的是创造特色。

比如过去五天的平均值，去年同期的数值，环比增加，同比增长。比如租房的场景，房租/卧室数量这些和业务非常相关的东西，其实是需要不断摸索才能找到的。XGBOOST can 不能帮助我们获得这些特性。

与深度学习相比，深度学习本质上依赖于特殊的结构，如LSTM和CNN，来获得适合于这项业务的特征。

那么分类功能在XGBOOST中并不是特别有用，如果相关性不是很大可以去掉。如果类别不多，比如只有个位数的类别，可以添加。如果类别很多，可以考虑使用CATBOOSTING或者LIGHTGBM。

进行战略性采购

-协助团队领导建立采购预算、商品策略和运营计划。

-研究采购营销，推荐新的潜在供应商支持买家

本地化协调

-负责本地化开发，并针对项目指导提供跨职能支持

-与采购/SDE/采购团队合作跟踪所有开发零件的过程，包括所有验证阶段

-与内部部门合作，协调和推进新的本地化流程

-本地化FAI跟踪列表，推动新的本地化流程

产品视图计算(面向项目)

-定期创建MLL零件清单，并用Fico数据更新采购价格

上一篇抖音极速版的购物车在什么位置抖音怎么加购物车一起支付？

下一篇快速选择工具怎么扩大或缩小选区 cad图例放大快捷键？