更新时间:2021-09-18 GMT+08:00
分享

创建特征工程

前提条件

Chrome最新版本支持JupyterLab平台,版本示例:87.0.4280.141。不支持62开头的版本或者比62更低的版本。

操作步骤

用户可以在“数据集详情”页面基于数据集实例新建特征工程,对数据集执行特征操作;也可以在“特征工程管理”页面新建特征工程。我们以在“特征工程管理”页面创建特征工程为例,操作步骤如下。

  1. 单击特征工程首页右上角的图标。

    弹出“特征处理”对话框。如图1所示。
    图1 创建特征工程

    配置“特征处理”对话框参数,具体参见表1
    表1 特征工程参数配置说明

    参数名称

    参数说明

    工程名称

    特征工程的名称。

    只能以字母(A~Z a~z)开头,由字母、数字(0~9)、下划线“_”、“-”组成,不能以下划线结尾,且长度为[1-50]个字符。

    工程描述

    特征工程描述信息。

    最多不超过500个字符。

    开发平台

    特征工程处理数据集的计算平台JupyterLab。

    规格

    计算平台的资源配置信息。请根据实际情况选择。

    实例

    创建JupyterLab运行环境的实例。可以从下拉框中选择已创建的运行环境或选择“新建一个新环境”。

  2. 单击“创建”。在特征工程首页的“特征工程”页签默认生成一行新的特征工程。

    等待特征工程“环境信息”列状态由“创建中”变更为“运行中”,即JupyterLab环境实例创建完成。

    可单击界面右上角的图标,从弹出的“环境信息”对话框中,查看环境的创建进展。

  3. 单击特征工程所在行,对应“操作”列的图标。

    进入JupyterLab环境编辑界面,如图2所示。在当前特征工程中,系统会自动创建名称与特征工程同名的算法工程。

    JupyterLab环境编辑界面说明,如表2所示。

    图2 JupyterLab环境编辑界面
    表2 JupyterLab环境编辑界面说明

    区域

    说明

    1

    算法工程详细信息查看区域。

    下述为图标的详细释义:

    • :算法工程目录列表。展示与算法工程同名的所有目录。双击目录名称,可查看算法工程包含的所有子目录和文件,如下所示:
      • softcomai目录:模型训练服务提供的SDK。
      • _train.json:超参配置信息。
      • *.ipynb:算法工程代码编辑和调试运行主文件。
      • requirements.txt:模型训练服务第三方依赖包列表。用户可根据实际需要写入依赖的第三方包。示例:tensorflow==1.8.1。
    • :数据集目录列表。展示用户当前项目OBS空间中的所有数据集列表。双击数据集目录,可查看其包含的数据列表。
    • :查看运行的所有JupyterLab环境信息,可单击“SHUT DOWN”,停止运行环境。
    • :Jupyterlab功能集。
    • :属性检查器,可查看右侧编辑界面上各Cell的属性。
    • :展示所有基于JupyterLab平台创建的算法工程操作流。单击特征操作名称,可直接定位到特征操作在编辑界面的位置。
    • :Jupyterlab第三方拓展功能管理。

    2

    JupyterLab平台自带的菜单项。

    3

    文件编辑时的快捷操作按钮。

    4

    模型训练服务预置的特征服务发布、基于整个Jupyterlab的模型包归档以及算法工程操作主文件格式转换的能力。

    5

    算法工程的内核信息,单击当前内核版本可重新选择内核。

    6

    JupyterLab预置的算子,主要包含数据处理、模型训练以及迁移学习能力。

    7

    算法工程操作编辑区域。算法工程操作的主文件为后缀名称是“ipynb”的文件。

新建算法工程

用户创建特征工程时,系统默认在特征工程中,为用户创建了同名的算法工程,如果需要在当前特征工程中,创建多个算法工程,可参考下述步骤操作。

  1. 在JupyterLab环境编辑界面,单击界面左上角的“File > New Launcher”,界面右侧新增“Launcher”页签。
  2. 在“Launcher”界面,单击“Algorithm”下方的“算法工程”,弹出的“新建”对话框。
  3. 输入“名称”,示例:code-123,单击“确定”。

    “code-123”算法工程创建完成,在界面左侧的代码目录,可以看到新增的“code-123”目录及其相关的主文件、子目录等。

    不同的算法工程,均会有与算法工程同名的目录,且同级展示。单击进入算法工程同名目录中,打开算法主文件“与算法工程同名.ipynb”,进行代码编辑操作。

相关文档