本文导读

操作步骤

展开导读

文档首页/ 网络智能体/ 数据资产管理服务/ 用户指南/ 管理基础工具/ 数据处理/ 管理新增作业/ 新增作业（通用编辑器）

新增作业（通用编辑器）

更新时间：2022-05-07 GMT+08:00

查看PDF

数据处理提供python脚本处理OBS数据的能力。用户可以根据实际情况本地上传数据文件，或者使用已有OBS数据，编写python处理脚本、scala或java jar包，处理数据。

操作步骤

在数据服务左侧导航，选择“工具箱>数据开发>数据处理”。
在“任务管理”界面，单击“新增作业”。

配置信息，参数说明见表1。

表1 参数说明
参数		说明
基本信息	作业名称	自定义输入。
	开发环境	该作业的运行环境。这里以“通用编辑器”为例。
	作业位置	存储作业脚本的数据湖OBS桶路径。支持从下拉框中选择OBS桶，自动带出存储路径。
	作业描述	作业描述信息。
配置信息	运行参数	Python脚本中设置的运行参数，可以在这里赋值。单击“添加运行参数”，可输入多组运行参数。

单击“下一步”。
在左侧单击“软件目录”页签，展示代码文件存放目录。
- 软件目录：代码文件存放目录。
- 数据目录：数据文件存放目录。
- ：新建文件夹。
- ：刷新左侧目录树。
- ：删除选中的目录或文件。
（可选）单击左侧目录中的“main.py”、"py_main.py"、"sdk_main.py"文件，界面右侧展示文件内容。

查看已有样例代码内容。
单击，自行上传编译好的Scala或者JAVA代码jar包；或者单击，自行在新增的脚本界面上编辑代码。
脚本编辑完成后，在键盘上按“Ctrl+s”，或者鼠标右键，单击“保存”。

在左侧下方“配置信息”区域，配置参数。

普通python作业运行参数配置，参数说明见表2。

表2 普通python作业运行参数说明
参数	说明
执行引擎	选择AI引擎和对应的Python语言版本，根据实际情况配置。样例1：选择PyTorch，根据实际情况配置对应的Python语言版本，例如：PyTorch-1.3.0-python3.7。样例2：选择TensorFlow，根据实际情况配置对应的Python语言版本，例如：TF-1.3.1-python3.7。样例3：选择XGBoost-Sklearn，根据实际情况配置对应的Python语言版本，例如：XGBoost-0.80-Sklearn-0.1.8.1-python2.7。
启动文件	单击右侧“选择”，在弹出的对话框中，选择需要执行的文件。
规格	选择执行作业的CPU和GPU配置。支持使用租户订购的ModelArts专属资源池。
计算节点规格	单节点运行。目前不支持修改。
运行参数	Python脚本中设置的运行参数，可以在这里赋值。

单击“保存配置”，在“提示”对话框单击“确定”，保存运行配置。
单击“提交运行”，开始执行作业。
（可选）在任务管理界面，支持如下操作。
- 支持按作业运行状态展示作业。例如，单击“成功”，任务列表仅展示“作业运行状态”值为“成功”的作业。
- 查看作业信息：在需要查看的作业对应的“操作”列下，单击。
- 运行/停止作业：在需要运行/停止的作业对应的“操作”列下，单击/。
- 运行后数据的处理：在需要数据处理的任务对应的“操作”列下，单击，在下拉列表中选择对应功能处理数据。
- 删除作业：在需要删除的作业对应的“操作”列下，单击>。
- 发布运行成功的数据为数据集：在需要发布的作业对应的“操作”列下，单击>。

父主题： 管理新增作业

上一篇：管理新增作业

下一篇：新增作业（JupyterLab开发环境）

相关文档

意见反馈

文档内容是否对您有帮助？

有帮助没帮助

提供反馈

提交成功！非常感谢您的反馈，我们会继续努力做到更好！您可在我的云声建议查看反馈及问题处理状态。

系统繁忙，请稍后重试

在使用文档中是否遇到以下问题

内容与产品页面不一致

内容不易理解

缺失示例代码

步骤不可操作

搜不到想要的内容

缺少最佳实践

意见反馈（选填）

0/500

请至少选择一项反馈信息并填写问题反馈

字符长度不能超过500

直接提交取消

如您有其它疑问，您也可以通过华为云社区问答频道来与我们联系探讨

智能客服提问云社区提问

下载华为云App

关注云资讯，随时随地管控云服务

文档反馈

文档反馈

意见反馈

0/500

标记内容

同时提交标记内容

登录并提交直接提交取消