训练模型
特征和算法确定后,可以开始训练模型。
训练模型
- 单击“模型选择”左下方的“训练模型”。
新增“训练模型”内容,如图1所示。
- 单击“训练模型”代码框左侧的图标,进行模型训练。
模型训练完成后,界面下方展示模型的评估效果。
第一列内容的含义如下所示:
- 0:标注为0的所有样本。可以理解为标签。
- 1:标注为1的所有样本。可以理解为标签。
- macro average:所有标签结果的平均值。
- weighted average:所有标签结果的加权平均值。
第一行内容的含义如下所示,即模型优劣的评价指标:
- f1-score:F1分数同时考虑精确率和召回率,让两者同时达到最高,取得平衡。
- precision:精确率,又被称为查准率,是针对预测结果而言的。含义为在被预测为正的样本中实际为正样本的概率。
- recall:召回率,又被称为查全率,是针对原样本而言的。含义为在实际为正的样本中被预测为正样本的概率。
- support:每类标签出现的次数。
模型训练完成后,可以查看归档的模型文件,如模型训练目录说明所示。
模型训练目录说明
模型训练完成后,训练好的模型和相关内容,都保存在如图2所示的model目录中。将model目录导出,使用新数据,直接利用已有的特征和参数、算法和参数,就可以实现模型重训练。
model目录的上级目录“learnware”是用户创建的学件项目名称。
model目录的子目录含义如下所示:
- feature_file:存放推荐的特征配置列表文件和KPI特征画像文件。
- model:存放训练好的模型。
- parameter_file:存放模型推荐的算法和参数配置文件。