更新时间:2024-05-10 GMT+08:00
分享

数据标注(可选)

使用数据标注业务之前,需创建训练集。每个技能最多创建10个训练集。

训练集是对话语料的集合,类似文件夹的作用,可以把不同来源的对话语料、不同时段获取的对话语料放在不同的对话训练集中。

训练集发布上线后,可以在对话体验中验证。

前提条件

在使用训练集之前,请确保已存在需要的意图和槽位信息。

创建训练集

  1. “技能管理”页面,单击技能名称进入“配置意图”页面,然后在页面上方单击“数据标注”
  2. “数据标注”页面,单击“创建”,弹出“创建训练集”对话框。
    图1 创建训练集
  3. 根据实际需要,输入“训练集名称”“描述”信息。
  4. 单击“确定”

添加训练语料

训练集创建完成后,您需要给训练集中添加训练语料,提供手工添加和批量导入两种训练语料添加方式,根据您的需要选择。

  • 方式一:手工添加训练语料
    1. “数据标注”页面,单击左侧训练集名称,进入对应的训练集管理页面。
    2. 在页面上方输入框中输入训练语料并按回车,或者输入训练语料后单击“添加”,自动添加至训练语料列表。
      图2 输入训练语料
  • 方式二:批量导入训练语料
    1. “数据标注”页面,单击左侧训练集名称,进入对应的训练集管理页面。
    2. 单击左上方“导入训练语料”按钮。
      图3 单击“导入训练语料”
    3. 单击“添加文件”添加需要导入的文件。

      您可以通过“下载模板”,下载文件模板填写数据。

      图4 导入训练语料
    4. 设置导入模式。

      导入模式有两种:追加和覆盖。

      • 选择追加模式不会对原语料造成影响。
      • 选择覆盖模式将删除原语料。
    5. 单击“确定”

      导入成功后,在训练语料列表中显示导入的语料信息。

标注意图及槽位

添加训练语料之后,您需要为语料标注意图及槽位,并确认标注。

  1. “数据标注”页面,单击左侧训练集名称,进入对应的训练集管理页面。
    图5 训练集管理
  2. “标注意图”列,单击下拉框,设置训练语料的意图。设置意图完成后,标注状态会变更为待确认。

    下拉框中sys.other为负例,用来标注需要过滤掉的语料。

  3. “训练语料”列,选中关键词,出现“选择槽位”悬浮框,设置相应槽位。

    槽位设置具体操作请参见配置意图章节。

    图6 选择槽位
  4. 单击操作列“确认标注”,状态变更为已标注,即表示标注完成。在技能训练时,只会使用状态为已标注的训练语料进行训练。

其他操作

  • 批量操作
    1. “数据标注”页面,单击左侧训练集名称,进入对应的训练集管理页面。
    2. 勾选训练语料,单击“批量操作”,可以执行批量标注意图、批量确认标注、批量删除操作。
      图7 批量操作
  • 编辑

    “数据标注”页面,单击左侧训练集名称,进入对应的训练集管理页面,可以编辑训练集名称和训练语料。
    图8 编辑训练集
  • 删除

    当某一训练集不再匹配业务诉求,您可以删除该训练集以释放资源。

    1. 在“数据标注”页面,鼠标悬浮在训练集名称上,单击删除图标。
      图9 删除训练集
    2. 在删除训练集对话框中,单击“确认”

相关文档