文档首页 > > 常见问题> 自动学习> 准备数据>

创建预测分析自动学习项目时,对训练数据有什么要求?

创建预测分析自动学习项目时,对训练数据有什么要求?

分享
更新时间:2021/02/26 GMT+08:00

数据集要求

  • 文件规范:名称由以字母数字及中划线下划线组成,以'.csv'结尾,且文件不能直接放在OBS桶的根目录下,应该存放在OBS桶的文件夹内。如:“/obs-xxx/data/input.csv”
  • 文件内容:文件保存为“csv”文件格式,文件内容以换行符(即字符“\n”,或称为LF)分隔各行,行内容以英文逗号(即字符“,”)分隔各列。文件内容不能包含中文字符,列内容不应包含英文逗号、换行符等特殊字符,不支持引号语法,建议尽量以字母及数字字符组成。
  • 训练数据:
    • 训练数据列数一致,总数据量不少于100条不同数据(有一个特征取值不同,即视为不同数据)。
    • 训练数据列内容不能有时间戳格式(如:yy-mm-dd、yyyy-mm-dd等)的数据。
    • 如果某一列的取值只有一种,会被视为无效列。请确保标签列的取值至少有两个且无数据缺失。

      标签列指的是在训练任务中被指定为训练目标的列,即最终通过该数据集训练得到模型时的输出(预测项)。

    • 除标签列外数据集中至少还应包含两个有效特征列(列的取值至少有两个且数据缺失比例低于10%)。
    • 训练数据的csv文件不能包含表头,否则会导致训练失败。
分享:

文档是否有解决您的问题?

提交成功!非常感谢您的反馈,我们会继续努力做到更好!
反馈提交失败,请稍后再试!

*必选

请至少选择或填写一项反馈信息

字符长度不能超过200

提交反馈 取消

如您有其它疑问,您也可以通过华为云社区论坛频道来与我们联系探讨

智能客服提问云社区提问