文档首页/ 网络智能体/ 模型训练服务/ 常见问题/ 特征工程/ 特征处理操作完成后怎么应用于数据集全量数据?
更新时间:2021-09-18 GMT+08:00
分享

特征处理操作完成后怎么应用于数据集全量数据?

使用Python和Spark开发平台创建的特征工程,界面所有特征操作执行完成后,单击“执行”时,系统自动将特征操作流应用于数据集全量数据,生成经过特征处理的数据集,供模型训练使用。用户在单击“执行”时,可以在“执行”对话框中,选择其他数据集,执行当前的特征操作流。添加的数据集,必须满足特征维度和特征列数量与当前特征工程绑定的数据集一致,否则会执行失败。

使用JupyterLab开发平台创建的算法工程,界面所有特征操作执行完成后,单击界面右上角的图标,选择“数据处理 > 数据集 > 生成数据实例”,在新增的“生成数据实例”代码框右侧选择数据集和数据实例,运行代码框。系统自动将特征操作流应用于数据集全量数据,生成经过特征处理的数据集,供模型训练使用。

用户可以在“数据集”界面查看新生成的数据。

相关文档