更新时间:2022-08-05 GMT+08:00
分享

推荐系统OBS文件夹规范

使用推荐系统时,需要在OBS创建桶并导入离线数据,同时作业所产生的数据也会保存在OBS中。为了方便您快速定位文件路径,建议您按照如下结构准备数据创建文件夹,并上传至OBS桶。

OBS文件夹示例

自定义OBS桶名
    │ obs-offline-data  用于存放用户行为表、用户属性表和物品属性表。
    │ obs-customize-data 用于存放用户自定义列表“customize.csv”,该列表应用于召回策略的人工导入策略。
    │ obs-filter-data 用于存放用户黑白名单,应用于过滤策略。
    │ obs-global-data 用于存放全局特征文件,例如放入名为“global_feature_info.json”的文件。
    │ obs-general-data 用于存放经过特征工程处理的宽表,又名通用格式数据。
    │ obs-pretrain-data 用于存放排序预处理任务生成的预训练数据。
    │ obs-error-data 用于存放异常数据输出路径,来源于近线策略。
    │ obs-nearline-data 用于存放近线任务结果数据,宽表形式。
    │ obs-model-data 排序模型保存路径。
    └ obs-config-data 计算引擎配置地址,用来记录计算引擎的日志。
分享:

    相关文档

    相关产品