数据标注
文本分类项目创建完成后,将自动跳转至“自动学习 > 数据标注”页面,界面默认“已标注”页签。当选择的数据集已存在标注好的数据时,将自动展示已标注数据。您也可以单击“未标注”页签,切换至“未标注”页面,展示数据集的输入目录中的未标注数据。
文本分类的数据标注
- 在“标注对象列表”中选中待标注文本,然后单击“标签集”区域中不同标签进行标注。
一个文本对象只能添加一个标签。
- 确认文件标签后,单击右下方“保存当前页”,完成标注。
当“标注对象列表”内容较多时,其区域下方将呈现翻页,请务必在本页完成标注后,单击“保存当前页”保存后再翻页。如果您未完成保存即翻页,将导致前一页的标注信息丢失,需重新标注。
添加或删除数据
自动学习项目中,数据来源为数据集中输入位置对应的OBS目录,当目录下的数据无法满足现有业务时,您可以在ModelArts自动学习页面中,添加或删除数据。
- 添加文件
在“未标注”页签下,可单击页面左上角的“添加文件”,您可以在弹出对话框中,选择本地文件上传。
上传文件格式需满足文本分类类型的数据集要求。
- 删除文本对象
在“已标注”页签或“未标注”页签下,选中需要删除的文本对象,单击页面左上角的“删除”,在弹出的对话框中,确认删除信息后,单击“确定”。
在“已标注”页签下,您还可以勾选“选择当前页”,单击“删除”,即可删除当前页下所有的文本对象及其标注信息。
修改已标注的数据
针对“已标注”的文本数据,仅支持删除此文本对象的标签。在“已标注”页签下,单击标签右上角的叉号,即可删除此文本对象的标签。在弹出的对话框中,确认信息无误后单击“确定”。标签删除后,此文本对象将被呈现至“未标注”页签下。
修改标签
针对文本分类的自动学习项目,项目创建成功后,您可以根据业务变化,修改用于标注的标签。支持添加、修改和删除标签。
- 添加标签
在“已标注”页签下,单击“全部标签”右侧的加号,在弹出“新增标签”对话框中,设置“标签名称”和“标签颜色”,然后单击“确定”完成标签添加。
- 修改标签
在“已标注”页签中“全部标签”的下方,选择需要修改的标签,单击操作列的编辑图标,在弹出“修改标签”对话框中,修改“标签名称”或“标签颜色”,然后单击“确定”完成标签修改。
- 删除标签
在“已标注”页签中“全部标签”的下方,选择需要删除的标签,单击操作列的删除图标,在弹出“删除”对话框中,选择“仅删除标签”或“删除标签及仅包含此标签的标注对象”,然后单击“确定”完成标签删除。
所有的删除操作均不可恢复,请谨慎操作。