更新时间:2024-03-26 GMT+08:00

模型训练

完成预测分析数据标注后,可进行模型的训练,得到预测分析的模型。部署上线步骤将使用预测模型发布在线预测服务。

操作步骤

  1. 在自动学习页面,单击创建成功的项目名称,进入“数据标注”页面,完成“标签列”“标签列数据类型”的选择。
  2. “数据标注”页面下方,单击“训练”,在弹出的“训练设置”对话框中,选择训练使用的“计算规格”,单击“下一步”进入配置页,确认规格后单击“提交”开始模型训练。

    预测分析类型的自动学习,只支持使用“自动学习专用实例CPU(8U)”训练模型。

    训练时间相对较长,建议您耐心等待。如果关闭或退出此页面,系统仍然在执行训练操作。

  3. “模型训练”页签中,待训练状态由“运行中”变为“已完成”,即完成模型的自动训练。
    图1 运行成功
  4. 训练完成后,您可以在界面中查看训练详情,如“标签列”“标签列数据类型”“准确率”“评估结果”等。

    该示例为二分类的离散型数值,评估效果参数说明请参见表1

    不同类型标签列数据产生的评估结果结果说明请参见评估结果说明

同一个自动学习项目可以训练多次,每次训练生成一个版本。如第一次训练版本号为“V001(xxx)”,下一个版本为“V002(xxx)”。基于训练版本可以对训练模型进行管理。当训练的模型达到目标后,再执行部署上线的操作。

评估结果说明

根据训练数据类的不同评估结果会包含不同的指标。

  • 离散值评估结果

    包含评估指标为召回率(Recall)、精确率(Precision)、准确率(Accuracy)与F1值(F1 Score)。下表为具体说明:

    表1 离散值评估结果包含指标说明

    参数

    说明

    召回率

    被用户标注为某个分类的所有样本中,模型正确预测为该分类的样本比率,反映模型对正样本的识别能力。

    精确率

    被模型预测为某个分类的所有样本中,模型正确预测的样本比率,反映模型对负样本的区分能力。

    准确率

    所有样本中,模型正确预测的样本比率,反映模型对样本整体的识别能力。

    F1值

    F1值是模型精确率和召回率的加权调和平均,用于评价模型的好坏,当F1较高时说明模型效果较好。

  • 连续数值评估结果

    包含评估指标为平均绝对误差(Mean Absolute Error)、均方误差(Mean Squared Error)与均方根误差(Root Mean Squared Error)。三个误差值能够表征真实值和预测值之间的差距。在多次建模的过程中,每一次建模结果都会产生一组误差值,评判一个模型好坏的方法就是看这三个误差值是否变小或者变大,误差值越小表示模型越好。