更新时间:2024-04-01 GMT+08:00

数据标注

项目创建完成后,将会自动跳转至新版自动学习页面,并开始运行,当数据标注节点的状态变为“等待操作”时,需要手动进行确认数据集中的数据标注情况,也可以对数据集中的数据进行标签的修改,数据的增加或删减。

图1 数据标注节点状态

双击“数据标注”节点,单击实例详情按钮,打开数据标注页面。

图2 单击实例详情

文本分类的数据标注

  1. “标注对象列表”中选中待标注文本,然后单击“标签集”区域中不同标签进行标注。

    一个文本对象只能添加一个标签。

  2. 确认文件标签后,单击右下方“保存当前页”,完成标注。

    “标注对象列表”内容较多时,其区域下方将呈现翻页,请务必在本页完成标注后,单击“保存当前页”保存后再翻页。如果您未完成保存即翻页,将导致前一页的标注信息丢失,需重新标注。

图3 数据标注-文本分类

添加或删除数据

自动学习项目中,数据来源为数据集中输入位置对应的OBS目录,当目录下的数据无法满足现有业务时,您可以在ModelArts自动学习页面中,添加或删除数据。

  • 添加文件

    “未标注”页签下,可单击页面左上角的“添加数据”,您可以在弹出对话框中,选择本地文件上传。

    上传文件格式需满足文本分类型的数据集要求

  • 删除文本对象

    “已标注”页签或“未标注”页签下,选中需要删除的文本对象,单击页面左上角的“删除”,在弹出的对话框中,确认删除信息后,单击“确定”

    “已标注”页签下,您还可以勾选“选择当前页”,单击“删除”,即可删除当前页下所有的文本对象及其标注信息。

图4 添加文件或删除文本对象

修改已标注的数据

针对“已标注”的文本数据,仅支持删除此文本对象的标签。在“已标注”页签下,在标签名称区域单击标签右上角的叉号,即可删除此文本对象的标签。标签删除后,此文本对象将被呈现至“未标注”页签下。

图5 删除已标注文本的标签

修改标签

针对文本分类的自动学习项目,项目创建成功后,您可以根据业务变化,修改用于标注的标签。支持添加、修改和删除标签。

  • 添加标签

    “未标注”页签下,单击“标签集”右侧的加号,在弹出“新增标签”对话框中,设置“标签名称”“标签颜色”,然后单击“确定”完成标签添加。

  • 修改标签

    “已标注”页签中“全部标签”的下方操作列,选择需要修改的标签,单击操作列的编辑图标,在弹出“修改标签”对话框中,修改“标签名称”“标签颜色”,然后单击“确定”完成标签修改。

  • 删除标签

    “已标注”页签中“全部标签”的下方,选择需要删除的标签,单击操作列的删除图标,在弹出“删除”对话框中,选择“仅删除标签”“删除标签及仅包含此标签的标注对象”,然后单击“确定”完成标签删除。

    所有的删除操作均不可恢复,请谨慎操作。

图6 修改标签

继续运行

完成数据的确认之后,返回新版自动学习的页面,在数据标注节点单击“继续运行”,工作流将会继续依次运行直到所有节点运行成功。

图7 继续运行