新增作业(JupyterLab开发环境)
支持普通Python作业、PySpark作业,提供单机版容器在线调试开发能力。
操作步骤
- 在数据服务左侧导航,选择 。
- 在“任务管理”界面,单击“新增作业”。
- 配置信息,参数说明见表1。
表1 参数说明 参数
说明
基本信息
作业名称
自定义输入。
开发环境
该作业的运行环境。这里以“JupyterLab交互式开发环境”为例。
作业位置
存储作业脚本的数据湖OBS桶路径。支持从下拉框中选择OBS桶,自动带出存储路径。
规格
JupyterLab开发环境规格。取值为“2核|8G”和“8核|32G”。支持使用租户订购的ModelArts专属资源池。
实例
JupyterLab开发环境实例。包含如下选项:
- 桶下同一规格已有环境,则自动带出实例名称,不支持修改。
- 桶下同一规格无环境,则显示“创建一个新环境”,不支持修改。
输出位置
选择逻辑实体,将实体的OBS文件位置作为Python代码中的数据输出位置。单击“选择数据输出位置”,可选择多个输出位置。
作业描述
作业描述信息。
配置信息
运行参数
Python脚本中设置的运行参数,可以在这里赋值。单击“添加运行参数”,可输入多组运行参数。
- 单击“创建”。
- 如果已选桶和规格(已有JupyterLab环境),单击“创建”,创建一个基于JupyterLab平台的任务,并自动跳转到任务管理页面。
- 如果已选桶和规格(无JupyterLab环境),单击“创建”,同时创建jupyterLab环境和基于jupyterLab平台的任务,并自动跳转到任务管理页面。
等待JupyterLab环境创建完成,即作业列表中任务所在行,对应“名称”列的值中有“可用”字样。
- 在任务管理界面,在作业对应的“名称”列下,单击作业名称。
- 在“选择开发环境规格”界面,单击“确定”。
参数说明如下:
操作结果如下:
- 桶下同一规格无环境,则显示新建一个环境,单击“确定”,创建JupyterLab环境,并返回任务管理界面。
- 桶下同一规格已有环境,单击“确定”,进入JupyterLab环境编辑器界面。
- 在JupyterLab编辑器界面,单击左侧的“文件浏览器”页签,展示代码文件存放目录。
- 单击左侧目录中的样例代码文件,界面右侧展示文件内容,此处以“main.py”文件为例。
查看已有样例代码内容。
- 单击界面右上角“返回作业列表”,返回作业管理界面。
- 在任务管理界面,在对应的“操作”列下,单击。
- 配置运行参数,参数说明见表3。
- 单击“保存配置”,在“提示”对话框单击“确定”,保存运行配置。
- 单击“提交运行”,开始执行作业。
- (可选)在任务管理界面,支持如下操作。
- 支持按作业运行状态展示作业。例如,单击“成功”,任务列表仅展示“作业运行状态”值为“成功”的作业。
- 查看作业信息:在需要查看的作业对应的“操作”列下,单击。
- 运行/停止作业:在需要运行/停止的作业对应的“操作”列下,单击/。
- 运行后数据的处理:在需要数据处理的任务对应的“操作”列下,单击,在下拉列表中选择对应功能处理数据。
- 删除作业:在需要删除的作业对应的“操作”列下,单击>。
- 发布处理完成的数据为数据集:在需要发布的作业对应的“操作”列下,单击>。