离线作业简介
RES提供了离线作业训练的功能,方便您根据业务需求查看作业结果并不断调整您的作业参数。您还可以基于离线作业得到的推荐候选集,用于在线服务计算得到推荐结果。RES提供了多种推荐离线作业功能,您可以直接使用得到满意的推荐候选集。
用户通过数据质量作业对离线数据进行质量检测,然后将检测合格的数据通过特征工程处理为可用于召回策略、过滤规则、排序策略、近线作业的数据。通过上述离线作业训练出可用于在线服务的推荐候选集。当在线服务运行完成,您可以通过效果评估检测推荐结果。
离线作业功能说明
离线作业 |
说明 |
详细指导 |
---|---|---|
组合作业 |
组合作业作为一个包含多个子任务的作业,通常用于多个召回、过滤、排序等任务。 |
|
数据质量 |
数据质量是用户在进行离线计算之前使用原始初始格式数据或者通用格式数据检测输入数据是否合法。 |
|
特征工程 |
特征工程常用于抽取用户、物品的特征和特定算法的特征生成,一般作为某些算法的前置输入条件。 |
|
召回策略 |
召回策略用于生成推荐的候选集,在原始数据中通过算法和规则匹配用户的候选集。 |
|
排序策略 |
排序策略根据不同的算法模型对召回策略或者近线策略生成的候选集进行重排序,得到推荐候选集列表。 |
|
过滤规则 |
过滤规则用于生成推荐的过滤集,包含黑白名单、历史行为过滤等特性。支持用户在线上推理过程中完成对相关物品的过滤。 |
|
效果评估 |
根据用户行为的数据回流,提供多维度的效果统计。 |