更新时间:2022-08-05 GMT+08:00
分享

创建在线服务

在线服务负责分析结果的应用过程,泛指部署线上服务后提供的推理服务,对外提供API接口。在推荐系统中,包含推荐引擎、文本标签、排序三种在线服务,具体说明如下:

  • 推荐引擎

    推荐引擎用于对RES召回策略跑出来的候选集结果进行融合过滤和排序。

  • 文本标签

    文本标签服务为用户提供自然语言处理工具,可用于关键词提取和命名实体识别。

  • 排序

    排序服务允许用户提供自己的候选集,使用RES的排序策略进行排序。

前提条件

  • 已经有计算成功的离线作业并且已经生成候选集UUID。
  • 您可以部署10个在线服务,每个在线服务可以创建2个在线流程 ,如需增加配额请您提工单处理。
  • 由于在线运行需消耗资源,确保账户未欠费。
  • 如果账户欠费,账号将被冻结,服务会被停止运行,您无法对服务执行调用、启动或者编辑操作。

操作步骤

  1. 登录RES管理控制台,在左侧导航栏选择进入“在线服务”页面。
  2. 在页面上方单击“创建”进入“创建在线服务”,在页面填写相关参数。
    1. 填写基本信息并选择服务类型。您可以根据实际情况填写“名称”“场景”“描述”信息。其中“场景”信息可选择您在全局配置页面创建的场景。
      图1 基本信息
    2. 根据业务需求选择服务类型。包括“推荐引擎”“排序”“文本标签”
    3. 单击“添加在线流程”,并进行命名,您最多可以部署5个在线流程。根据选择的服务类型配置在线流程,包括融合、过滤、排序和模型及配置等关键信息。具体参数信息参见表1。服务类型选择推荐引擎。
      图2 创建在线服务
      表1 创建在线服务参数说明

      参数名称

      子参数

      说明

      融合

      “推荐结果设置”

      “添加推荐候选集”(选择离线或近线任务所生成的推荐候选集进行排序)

      • 任务别名和UUID:单击操作列表的“选择”添加离线或近线的任务名称和候选集ID。
      • 优先级:优先级高的推荐结果将确保展示在优先级低的之前。
      • 同优先级数据占比:优先级相同的推荐候选集,该占比展示推荐数量,同优先级下的数据占比之和需要等于100%。

      “添加在线候选集”(根据设置的参数在线进行召回,必须添加全局特征信息文件才可设置参数)

      • 任务别名和UUID:分别默认为“在线候选集召回”“online-recall”,无需改动。
      • 优先级、同优先级数据占比:同添加推荐候选集。
      • 设置参数:单击操作列的“设置参数”进行召回策略参数的配置。根据业务需求选择召回类型为物品或者用户,配置在线召回特征。在线召回的特征属性来自于公共配置的全局特征信息文件。

      可单击“添加推荐候选集、添加在线候选集”配置多个候选集,作为当前在线流程的排序候选集。

      说明:

      在线候选集的延迟较推荐候选集较高,如无特殊需求,建议选择推荐候选集。

      容错

      容错用于数据请求异常时的固定人工输出召回集。需要在离线作业创建召回策略进行人工策略的计算。单击“选择”获取人工导入策略的任务别名和UUID。

      离线过滤

      过滤

      过滤数据来源于过滤规则产生的候选集,单击“选择”获取过滤的任务别名和UUID。

      在线过滤

      【去重】物品属性

      属性名从画像算子生成,如“product_color”,则对产品颜色相同的物品进行去重。

      【去重】忽略长度

      截断物品ID末尾指定长度后的字符串进行去重,如指定长度为2,则SKU_A1234和SKU_A1244只会保留其中一个。

      属性过滤规则

      指定定制化用户属性以及物品属性过滤规则,属性过滤规则用于过滤最终用户的推荐结果。例如,对于一线城市的用户过滤敏感信息物品,使之不进入候选集。单击增加属性过滤规则。

      • 用户属性:指定在用户属性中需要过滤的字段,包含属性名和属性值。来源于画像数据,即特征工程初始用户画像-物品画像-标准宽表生成算子作业输出的数据,用户属性来自于公共配置的全局特征信息文件。如过滤籍贯是广东且性别为男性的用户。
      • 物品属性:指定在物品属性中需要过滤的字段,包含属性名和属性值。来源于画像数据,即特征工程初始用户画像-物品画像-标准宽表生成算子作业输出的数据,物品属性的名称来自于公共配置的全局特征信息文件。如过滤产品颜色为红色且产品品牌为华为的物品。

      排序方式

      “点击率预估”

      • 特征工程:排序数据来源于排序算子作业产生的候选集。单击“选择”获取排序策略的任务别名和UUID。
      • 模型文件路径:排序策略生成的模型存储路径。

      “属性权重”

      属性权重:输入属性,权重默认1.0 。也可单击“增加属性权重”。

      公共配置

      “全局特征信息文件”

      为json格式文件。指定在去重过滤即属性过滤中物品属性和用户属性的特征信息文件,如物品属性需要“feature_name”“feature_type”“feature_value_type”字段来表示特征名,特征类型以及特征值类型。需预先存储在OBS中。

      “画像”

      画像为特征工程初始用户画像-物品画像-标准宽表生成算子的结果。且此画像会用于去重过滤、属性过滤以及排序的计算中。单击“选择”获取特征工程作业产生的UUID。

      模型及配置

      -

      设置模型名称、模型版本、计算节点规格、计算节点个数和分流(%)。

      模型名称和模型版本选择调用API接口的模型名称和模型版本。“计算节点规格”默认2核|8GiB,“计算节点个数”默认为2,“分流”之和必须是100%。

  3. 完成该项配置后,单击“下一步”进入规格确认页面,核对无误后,单击“完成”。当您通过在线服务列表查看在线服务的状态由“初始化”“部署中”变更为“运行中”时即完成在线服务的部署。在线服务一般需要运行一段时间,根据您的数据量和资源不同,运行时间将耗时几分钟到几十分钟不等,请您耐心等待。

相关文档