更新时间:2022-05-07 GMT+08:00
分享

新增作业(JupyterLab开发环境)

支持普通Python作业、PySpark作业,提供单机版容器在线调试开发能力。

操作步骤

  1. 在数据服务左侧导航,选择工具箱>数据开发>数据处理
  2. “任务管理”界面,单击“新增作业”
  3. 配置信息,参数说明见表1

    表1 参数说明

    参数

    说明

    基本信息

    作业名称

    自定义输入。

    开发环境

    该作业的运行环境。这里以“JupyterLab交互式开发环境”为例。

    作业位置

    存储作业脚本的数据湖OBS桶路径。支持从下拉框中选择OBS桶,自动带出存储路径。

    规格

    JupyterLab开发环境规格。取值为“2核|8G”和“8核|32G”。支持使用租户订购的ModelArts专属资源池。

    实例

    JupyterLab开发环境实例。包含如下选项:

    • 桶下同一规格已有环境,则自动带出实例名称,不支持修改。
    • 桶下同一规格无环境,则显示“创建一个新环境”,不支持修改。

    输出位置

    选择逻辑实体,将实体的OBS文件位置作为Python代码中的数据输出位置。单击“选择数据输出位置”,可选择多个输出位置。

    作业描述

    作业描述信息。

    配置信息

    运行参数

    Python脚本中设置的运行参数,可以在这里赋值。单击“添加运行参数”,可输入多组运行参数。

  4. 单击“创建”

    • 如果已选桶和规格(已有JupyterLab环境),单击“创建”,创建一个基于JupyterLab平台的任务,并自动跳转到任务管理页面。
    • 如果已选桶和规格(无JupyterLab环境),单击“创建”,同时创建jupyterLab环境和基于jupyterLab平台的任务,并自动跳转到任务管理页面。

    等待JupyterLab环境创建完成,即作业列表中任务所在行,对应“名称”列的值中有“可用”字样。

  5. 在任务管理界面,在作业对应的“名称”列下,单击作业名称。
  6. “选择开发环境规格”界面,单击“确定”

    参数说明如下:
    • 规格:JupyterLab开发环境规格。取值为“2核|8G”和“8核|32G”。

      支持使用租户订购的ModelArts专属资源池。

    • 实例:JupyterLab开发环境实例。区分如下两种情况:
      • 桶下同一规格已有环境,则自动带出实例名称,不支持修改。
      • 桶下同一规格无环境,则显示“创建一个新环境”,不支持修改。

    操作结果如下:

    • 桶下同一规格无环境,则显示新建一个环境,单击“确定”,创建JupyterLab环境,并返回任务管理界面。
    • 桶下同一规格已有环境,单击“确定”,进入JupyterLab环境编辑器界面。

  7. 在JupyterLab编辑器界面,单击左侧的“文件浏览器”页签,展示代码文件存放目录。

    作业编辑界面如图1所示,界面说明见表2

    图1 作业编辑界面
    表2 作业编辑界面说明

    区域

    界面元素

    说明

    1

    文件浏览器

    文件存放目录。

    2

    代码编辑区域

    单击代码目录中的文件,右侧展示文件内容。支持编辑修改代码文件在线运行。

    3

    返回作业列表

    单击“返回作业列表”,回到任务管理界面,查看作业列表。

  8. 单击左侧目录中的样例代码文件,界面右侧展示文件内容,此处以“main.py”文件为例。

    查看已有样例代码内容。

  9. 单击界面右上角“返回作业列表”,返回作业管理界面。
  10. 在任务管理界面,在对应的“操作”列下,单击
  11. 配置运行参数,参数说明见表3

    表3 运行参数说明

    参数

    说明

    执行引擎

    选择AI引擎和对应的Python语言版本。

    启动文件

    单击右侧“选择”,在弹出的对话框中,这里选择“main.py”文件。

    规格

    选择执行作业的CPU和GPU配置。

    支持使用租户订购的ModelArts专属资源池。

    计算节点规格

    单节点运行。目前不支持修改。

    运行参数

    Python脚本中设置的运行参数,可以在这里赋值。

    输出位置

    选择逻辑实体,将实体的OBS文件位置作为Python代码中的数据输出位置。

  12. 单击“保存配置”,在“提示”对话框单击“确定”,保存运行配置。
  13. 单击“提交运行”,开始执行作业。
  14. (可选)在任务管理界面,支持如下操作。

    • 支持按作业运行状态展示作业。例如,单击“成功”,任务列表仅展示“作业运行状态”值为“成功”的作业。
    • 查看作业信息:在需要查看的作业对应的“操作”列下,单击
    • 运行/停止作业:在需要运行/停止的作业对应的“操作”列下,单击/
    • 运行后数据的处理:在需要数据处理的任务对应的“操作”列下,单击,在下拉列表中选择对应功能处理数据。
    • 删除作业:在需要删除的作业对应的“操作”列下,单击>
    • 发布处理完成的数据为数据集:在需要发布的作业对应的“操作”列下,单击>

相关文档