标注文本分类数据
项目创建完成后,将会自动跳转至新版自动学习页面,并开始运行,当数据标注节点的状态变为“等待操作”时,需要手动进行确认数据集中的数据标注情况,也可以对数据集中的数据进行标签的修改,数据的增加或删减。
双击“数据标注”节点,单击实例详情按钮,打开数据标注页面。
文本分类的数据标注
- 在“标注对象列表”中选中待标注文本,然后单击“标签集”区域中不同标签进行标注。
一个文本对象只能添加一个标签。
- 确认文件标签后,单击右下方“保存当前页”,完成标注。
当“标注对象列表”内容较多时,其区域下方将呈现翻页,请务必在本页完成标注后,单击“保存当前页”保存后再翻页。如果您未完成保存即翻页,将导致前一页的标注信息丢失,需重新标注。
添加或删除数据
自动学习项目中,数据来源为数据集中输入位置对应的OBS目录,当目录下的数据无法满足现有业务时,您可以在ModelArts自动学习页面中,添加或删除数据。
- 添加文件
在“未标注”页签下,可单击页面左上角的“添加数据”,您可以在弹出对话框中,选择本地文件上传。
上传文件格式需满足文本分类型的数据集要求。
- 删除文本对象
在“已标注”页签或“未标注”页签下,选中需要删除的文本对象,单击页面左上角的“删除”,在弹出的对话框中,确认删除信息后,单击“确定”。
在“已标注”页签下,您还可以勾选“选择当前页”,单击“删除”,即可删除当前页下所有的文本对象及其标注信息。
修改已标注的数据
针对“已标注”的文本数据,仅支持删除此文本对象的标签。在“已标注”页签下,在标签名称区域单击标签右上角的叉号,即可删除此文本对象的标签。标签删除后,此文本对象将被呈现至“未标注”页签下。
修改标签
针对文本分类的自动学习项目,项目创建成功后,您可以根据业务变化,修改用于标注的标签。支持添加、修改和删除标签。
继续运行
完成数据的确认之后,返回新版自动学习的页面,在数据标注节点单击“继续运行”,工作流将会继续依次运行直到所有节点运行成功。