数据标注(可选)
使用数据标注业务之前,需创建训练集。每个技能最多创建10个训练集。
训练集是对话语料的集合,类似文件夹的作用,可以把不同来源的对话语料、不同时段获取的对话语料放在不同的对话训练集中。
训练集发布上线后,可以在对话体验中验证。
前提条件
在使用训练集之前,请确保已存在需要的意图和槽位信息。
创建训练集
- 在“技能管理”页面,单击技能名称进入“配置意图”页面,然后在页面上方单击“数据标注”。
- 在“数据标注”页面,单击“创建”,弹出“创建训练集”对话框。
图1 创建训练集
- 根据实际需要,输入“训练集名称”、“描述”信息。
- 单击“确定”。
添加训练语料
训练集创建完成后,您需要给训练集中添加训练语料,提供手工添加和批量导入两种训练语料添加方式,根据您的需要选择。
- 方式一:手工添加训练语料
- 在“数据标注”页面,单击左侧训练集名称,进入对应的训练集管理页面。
- 在页面上方输入框中输入训练语料并按回车,或者输入训练语料后单击“添加”,自动添加至训练语料列表。
图2 输入训练语料
- 方式二:批量导入训练语料
标注意图及槽位
添加训练语料之后,您需要为语料标注意图及槽位,并确认标注。
- 在“数据标注”页面,单击左侧训练集名称,进入对应的训练集管理页面。
图5 训练集管理
- 在“标注意图”列,单击下拉框,设置训练语料的意图。设置意图完成后,标注状态会变更为待确认。
下拉框中sys.other为负例,用来标注需要过滤掉的语料。
- 在“训练语料”列,选中关键词,出现“选择槽位”悬浮框,设置相应槽位。
槽位设置具体操作请参见配置意图章节。
图6 选择槽位
- 单击操作列“确认标注”,状态变更为已标注,即表示标注完成。在技能训练时,只会使用状态为已标注的训练语料进行训练。