更新时间:2024-11-22 GMT+08:00

训练预测分析模型

创建自动学习后,将会进行模型的训练,得到预测分析的模型。模型部署步骤将使用预测模型发布在线预测服务。

操作步骤

  1. 在新版自动学习页面,单击创建成功的项目名称,查看当前工作流的执行情况。
  2. “预测分析”节点中,待节点状态由“运行中”变为“运行成功”,即完成了模型的自动训练。
  3. 训练完成后,您可以在预测分析节点中单击查看训练详情,如“标签列”“标签列数据类型”“准确率”“评估结果”等。

    该示例为二分类的离散型数值,评估效果参数说明请参见表1

    不同类型标签列数据产生的评估结果说明请参见评估结果说明

同一个自动学习项目可以训练多次,每次训练会注册一个新的模型一个版本。如第一次训练版本号为“0.0.1”,下一个版本为“0.0.2”。基于训练版本可以对训练模型进行管理。当训练的模型达到目标后,再执行模型部署的操作。

评估结果说明

根据训练数据类的不同评估结果会包含不同的指标。

  • 离散值评估结果

    包含评估指标为召回率(Recall)、精确率(Precision)、准确率(Accuracy)与F1值(F1 Score)。下表为具体说明:

    表1 离散值评估结果包含指标说明

    参数

    说明

    recall:召回率

    被用户标注为某个分类的所有样本中,模型正确预测为该分类的样本比率,反映模型对正样本的识别能力。

    precision:精确率

    被模型预测为某个分类的所有样本中,模型正确预测的样本比率,反映模型对负样本的区分能力。

    accuracy:准确率

    所有样本中,模型正确预测的样本比率,反映模型对样本整体的识别能力。

    f1:F1值

    F1值是模型精确率和召回率的加权调和平均,用于评价模型的好坏,当F1较高时说明模型效果较好。

  • 连续数值评估结果

    包含评估指标为平均绝对误差(Mean Absolute Error)、均方误差(Mean Squared Error)与均方根误差(Root Mean Squared Error)。三个误差值能够表征真实值和预测值之间的差距。在多次建模的过程中,每一次建模结果都会产生一组误差值,评判一个模型好坏的方法就是看这三个误差值是否变小或者变大,误差值越小表示模型越好。