文档首页> AI开发平台ModelArts> 开发环境> ML Studio> 预置算子说明> 数据特征> 特征工程> gbdt编码模型训练

更新时间：2023-05-16 GMT+08:00

gbdt编码模型训练

概述

利用训练好的gbdt分类模型对输入的特征进行离散化处理。对每棵树的叶子节点进行编码，预测的时候遍历到叶子节点对应位置的编码为1，该树其余节点的编码为0。该节点主要用于生产gbdt的分类模型，并存储到输入参数对应的位置上。

输入

参数	子参数	参数说明
inputs	dataframe	inputs为字典类型，dataframe为pyspark中的DataFrame类型对象，用于生成gbdt编码的模型

输出

参数	子参数	参数说明
outputs	output_port_1	指向一个pyspark的DataFrame类型对象，该对象为一个空的dataframe

参数说明

参数	是否必选	参数说明	默认值
input_features	是	输入的特征（需要编码的特征）	"feature"
label_column	是	预测结果类别的字段名	"label"
model_saved_path	是	模型保存的路径	""
max_iter	是	最大迭代次数（树的棵数）	4
max_depth	是	树的最大深度	5
subsampling_rate	是	构建单棵树的采样比例	1.0
feature_subset_strategy	是	构建单棵树的特征抽取策略，取值为"auto"、"all"	"auto"

样例

数据样本

label,age,count
1,20,23
0,19,33
0,21,24
1,7,24
0,11,43
1,32,12
0,21,43
1,32,45

配置流程

运行流程

点击放大

参数设置

查看结果

点击放大

父主题： 特征工程

上一篇：特征异常平滑

下一篇：gbdt编码模型应用

意见反馈

文档内容是否对您有帮助？

有帮助没帮助

提供反馈

提交成功！非常感谢您的反馈，我们会继续努力做到更好！您可在我的云声建议查看反馈及问题处理状态。

系统繁忙，请稍后重试

在使用文档中是否遇到以下问题

内容与产品页面不一致

内容不易理解

缺失示例代码

步骤不可操作

搜不到想要的内容

缺少最佳实践

意见反馈（选填）

0/500

请至少选择一项反馈信息并填写问题反馈

字符长度不能超过500

直接提交取消

如您有其它疑问，您也可以通过华为云社区问答频道来与我们联系探讨

智能客服提问云社区提问

gbdt编码模型训练

概述

输入

输出

参数说明

样例

相关文档

相关产品

意见反馈

文档内容是否对您有帮助？

7*24

备案

专业服务

退订

建议反馈

售前咨询热线