更新时间:2023-01-18 GMT+08:00

数据标注

文本分类项目创建完成后,将自动跳转至“自动学习 > 数据标注”页面,界面默认“已标注”页签。当选择的数据集已存在标注好的数据时,将自动展示已标注数据。您也可以单击“未标注”页签,切换至“未标注”页面,展示数据集的输入目录中的未标注数据。

文本分类的数据标注

  1. “标注对象列表”中选中待标注文本,然后单击“标签集”区域中不同标签进行标注。

    一个文本对象只能添加一个标签。

  2. 确认文件标签后,单击右下方“保存当前页”,完成标注。

    “标注对象列表”内容较多时,其区域下方将呈现翻页,请务必在本页完成标注后,单击“保存当前页”保存后再翻页。如果您未完成保存即翻页,将导致前一页的标注信息丢失,需重新标注。

图1 数据标注-文本分类

添加或删除数据

自动学习项目中,数据来源为数据集中输入位置对应的OBS目录,当目录下的数据无法满足现有业务时,您可以在ModelArts自动学习页面中,添加或删除数据。

  • 添加文件

    “未标注”页签下,可单击页面左上角的“添加文件”,您可以在弹出对话框中,选择本地文件上传。

    上传文件格式需满足文本分类类型的数据集要求

  • 删除文本对象

    “已标注”页签或“未标注”页签下,选中需要删除的文本对象,单击页面左上角的“删除”,在弹出的对话框中,确认删除信息后,单击“确定”

    “已标注”页签下,您还可以勾选“选择当前页”,单击“删除”,即可删除当前页下所有的文本对象及其标注信息。

图2 添加文件或删除文本对象

修改已标注的数据

针对“已标注”的文本数据,仅支持删除此文本对象的标签。在“已标注”页签下,单击标签右上角的叉号,即可删除此文本对象的标签。在弹出的对话框中,确认信息无误后单击“确定”。标签删除后,此文本对象将被呈现至“未标注”页签下。

图3 删除已标注文本的标签

修改标签

针对文本分类的自动学习项目,项目创建成功后,您可以根据业务变化,修改用于标注的标签。支持添加、修改和删除标签。

  • 添加标签

    “已标注”页签下,单击“全部标签”右侧的加号,在弹出“新增标签”对话框中,设置“标签名称”“标签颜色”,然后单击“确定”完成标签添加。

  • 修改标签

    “已标注”页签中“全部标签”的下方,选择需要修改的标签,单击操作列的编辑图标,在弹出“修改标签”对话框中,修改“标签名称”“标签颜色”,然后单击“确定”完成标签修改。

  • 删除标签

    “已标注”页签中“全部标签”的下方,选择需要删除的标签,单击操作列的删除图标,在弹出“删除”对话框中,选择“仅删除标签”“删除标签及仅包含此标签的标注对象”,然后单击“确定”完成标签删除。

    所有的删除操作均不可恢复,请谨慎操作。

图4 修改标签