创建在线服务
在线服务负责分析结果的应用过程,泛指部署线上服务后提供的推理服务,对外提供API接口。在推荐系统中,包含推荐引擎、文本标签、排序三种在线服务,具体说明如下:
- 推荐引擎
推荐引擎用于对RES召回策略跑出来的候选集结果进行融合过滤和排序。
- 文本标签
文本标签服务为用户提供自然语言处理工具,可用于关键词提取和命名实体识别。
- 排序
排序服务允许用户提供自己的候选集,使用RES的排序策略进行排序。
前提条件
- 已经有计算成功的离线作业并且已经生成候选集UUID。
- 您可以部署10个在线服务,每个在线服务可以创建2个在线流程 ,如需增加配额请您提工单处理。
- 由于在线运行需消耗资源,确保账户未欠费。
- 如果账户欠费,账号将被冻结,服务会被停止运行,您无法对服务执行调用、启动或者编辑操作。
操作步骤
- 登录RES管理控制台,在左侧导航栏选择进入“在线服务”页面。
- 在页面上方单击“创建”进入“创建在线服务”,在页面填写相关参数。
- 填写基本信息并选择服务类型。您可以根据实际情况填写“名称”、“场景”和“描述”信息。其中“场景”信息可选择您在全局配置页面创建的场景。
图1 基本信息
- 根据业务需求选择服务类型。包括“推荐引擎”、“排序”和“文本标签”。
- 单击“添加在线流程”,并进行命名,您最多可以部署5个在线流程。根据选择的服务类型配置在线流程,包括融合、过滤、排序和模型及配置等关键信息。具体参数信息参见表1。服务类型选择推荐引擎。
图2 创建在线服务
表1 创建在线服务参数说明 参数名称
子参数
说明
融合
“推荐结果设置”
“添加推荐候选集”(选择离线或近线任务所生成的推荐候选集进行排序)
- 任务别名和UUID:单击操作列表的“选择”添加离线或近线的任务名称和候选集ID。
- 优先级:优先级高的推荐结果将确保展示在优先级低的之前。
- 同优先级数据占比:优先级相同的推荐候选集,该占比展示推荐数量,同优先级下的数据占比之和需要等于100%。
“添加在线候选集”(根据设置的参数在线进行召回,必须添加全局特征信息文件才可设置参数)
- 任务别名和UUID:分别默认为“在线候选集召回”和“online-recall”,无需改动。
- 优先级、同优先级数据占比:同添加推荐候选集。
- 设置参数:单击操作列的“设置参数”进行召回策略参数的配置。根据业务需求选择召回类型为物品或者用户,配置在线召回特征。在线召回的特征属性来自于公共配置的全局特征信息文件。
可单击“添加推荐候选集、添加在线候选集”配置多个候选集,作为当前在线流程的排序候选集。
说明:在线候选集的延迟较推荐候选集较高,如无特殊需求,建议选择推荐候选集。
容错
容错用于数据请求异常时的固定人工输出召回集。需要在离线作业创建召回策略进行人工策略的计算。单击“选择”获取人工导入策略的任务别名和UUID。
离线过滤
过滤
过滤数据来源于过滤规则产生的候选集,单击“选择”获取过滤的任务别名和UUID。
在线过滤
【去重】物品属性
属性名从画像算子生成,如“product_color”,则对产品颜色相同的物品进行去重。
【去重】忽略长度
截断物品ID末尾指定长度后的字符串进行去重,如指定长度为2,则SKU_A1234和SKU_A1244只会保留其中一个。
属性过滤规则
指定定制化用户属性以及物品属性过滤规则,属性过滤规则用于过滤最终用户的推荐结果。例如,对于一线城市的用户过滤敏感信息物品,使之不进入候选集。单击增加属性过滤规则。
- 用户属性:指定在用户属性中需要过滤的字段,包含属性名和属性值。来源于画像数据,即特征工程中初始用户画像-物品画像-标准宽表生成算子作业输出的数据,用户属性来自于公共配置的全局特征信息文件。如过滤籍贯是广东且性别为男性的用户。
- 物品属性:指定在物品属性中需要过滤的字段,包含属性名和属性值。来源于画像数据,即特征工程中初始用户画像-物品画像-标准宽表生成算子作业输出的数据,物品属性的名称来自于公共配置的全局特征信息文件。如过滤产品颜色为红色且产品品牌为华为的物品。
排序方式
“点击率预估”
- 特征工程:排序数据来源于排序算子作业产生的候选集。单击“选择”获取排序策略的任务别名和UUID。
- 模型文件路径:排序策略生成的模型存储路径。
“属性权重”
属性权重:输入属性,权重默认1.0 。也可单击“增加属性权重”。
公共配置
“全局特征信息文件”
为json格式文件。指定在去重过滤即属性过滤中物品属性和用户属性的特征信息文件,如物品属性需要“feature_name”、“feature_type”、“feature_value_type”字段来表示特征名,特征类型以及特征值类型。需预先存储在OBS中。
“画像”
画像为特征工程中初始用户画像-物品画像-标准宽表生成算子的结果。且此画像会用于去重过滤、属性过滤以及排序的计算中。单击“选择”获取特征工程作业产生的UUID。
模型及配置
-
设置模型名称、模型版本、计算节点规格、计算节点个数和分流(%)。
模型名称和模型版本选择调用API接口的模型名称和模型版本。“计算节点规格”默认2核|8GiB,“计算节点个数”默认为2,“分流”之和必须是100%。
- 填写基本信息并选择服务类型。您可以根据实际情况填写“名称”、“场景”和“描述”信息。其中“场景”信息可选择您在全局配置页面创建的场景。
- 完成该项配置后,单击“下一步”进入规格确认页面,核对无误后,单击“完成”。当您通过在线服务列表查看在线服务的状态由“初始化”、“部署中”变更为“运行中”时即完成在线服务的部署。在线服务一般需要运行一段时间,根据您的数据量和资源不同,运行时间将耗时几分钟到几十分钟不等,请您耐心等待。