更新时间:2024-03-26 GMT+08:00

模型训练

完成音频标注后,可进行模型的训练。模型训练的目的是得到满足需求的声音分类模型。由于用于训练的音频,至少有2种以上的分类,每种分类的音频数不少于5个。因此在发布训练之前,请确保已标注的音频符合要求,否则下方“开始训练”按钮会处于灰色状态。

操作步骤

在开始训练之前,需要设置训练参数,然后再开始模型的自动训练。

  1. 在自动学习页面,单击创建成功的项目名称,进入“数据标注”页面,完成数据标注。
    图1 完成数据标注
  2. “数据标注”页面,单击右上角“开始训练”,然后在弹出的“训练设置”对话框中,参考表1填写相关参数,然后单击“确定”,开始进行模型训练。
    图2 训练参数设置
    表1 训练设置参数说明

    参数

    说明

    默认值

    数据集版本名称

    此版本即数据管理中发布数据集时设置的版本。自动学习项目中,启动训练作业时,会基于前面的数据标注,将数据集发布为一个版本。

    系统将自动给出一个版本号,您也可以根据实际情况进行填写。

    系统随机给出

    最大训练时长(分钟)

    设置最大训练时长,在该时长内若训练还未完成,则强制退出。为防止训练中退出,建议使用较大值。输入取值范围为6~6000。

    60

    计算规格

    选择训练使用的资源规格,默认支持如下两种:

    • “增强计算型1实例-自动学习(GPU)”:按需计费的规格。
    • “自动学习免费规格(GPU)”:免费规格,使用此规格不收费。但是使用此规格时,训练作业在1小时后会自动停止,即1次最多只能使用1个小时。建议评估下您的数据大小,确保训练作业不要超过1小时。当使用人数较多时,此免费规格需排队等待。

    自动学习(GPU)

  3. 训练参数设置完成后,单击“下一步”进入配置页,确认规格后单击“提交”进行模型的自动训练,训练时间相对较长,建议您耐心等待。如果关闭或退出此页面,系统仍然在执行训练操作。
  4. “模型训练”页签中,待训练状态由“运行中”变为“已完成”,即完成模型的自动训练。
  5. 训练完成后,您可以在界面中查看训练详情,如“准确率”“评估结果”“训练参数”“分类统计表”等。
    图3 训练详情
    表2 评估结果参数说明

    参数

    说明

    召回率

    被用户标注为某个分类的所有样本中,模型正确预测为该分类的样本比率,反映模型对正样本的识别能力。

    精确率

    被模型预测为某个分类的所有样本中,模型正确预测的样本比率,反映模型对负样本的区分能力。

    准确率

    所有样本中,模型正确预测的样本比率,反映模型对样本整体的识别能力。

    F1值

    F1值是模型精确率和召回率的加权调和平均,用于评价模型的好坏,当F1较高时说明模型效果较好。

同一个自动学习项目可以训练多次,每次训练生成一个版本。如第一次训练版本号为“V001(xxx)”,下一个版本为“V002(xxx)”。基于训练版本可以对训练模型进行管理。当训练的模型达到目标后,再执行部署上线的操作。