更新时间:2023-06-02 GMT+08:00

选择标签列

创建预测分析项目后,需要选择数据标签列及标签列数据类型。在预测分析“数据标注”页面,可预览数据并完成标签列以及标签列数据类型选择,当前由于特征筛选算法限制,标签列必须是数据集的最后一列。模型训练将会使用全部数据训练预测模型,该模型以其他列的数据为输入,以标签列的预测值为输出。

操作步骤

  1. 选择“标签列”。在“数据标注”页面中,预览数据并选择训练目标。在“标签列”下拉框中选择需要设置为标签列的名称。

    标签列是预测模型的输出。此处训练目标是鸢尾花的品种(即“attr_5”),该列目标结果是“离散值”。训练目标选择完成后,单击“训练”

  2. 选择“标签列数据类型”。在“数据标注”页面中,“标签列数据类型”下选择合适的数据类型。
    • 若标签列为枚举型数据,数据类型应选择“离散值”,预测分析将训练分类模型。
    • 若标签列为数值型连续数据,数据类型应选择“连续数值”,预测分析将训练回归模型。
    • 分类问题(离散值)在模型训练完成后,评估结果会展现召回率(Recall)、精确率(Precision)、准确率(Accuracy)及F1值(F1 Score)。
    • 连续值在模型训练完成后,评估结果会展现平均绝对误差(Mean Absolute Error),均方误差(Mean Squared Error),均方根误差(Root Mean Squared Error)。