更新时间:2024-04-17 GMT+08:00
分享

创建自定义场景

自定义场景基于用户群体不同推荐场景的需求,提供了多种多样的推荐策略和算法,实现了端到端的自定义推荐场景搭建,使每一个推荐场景都能得到针对性的推荐效果提升。

前提条件

  • 已经存在创建成功并完成数据探索的数据源。
  • 由于训练作业运行需消耗资源,确保账户未欠费。
  • 确保您使用的OBS目录与RES在同一区域。

基本信息

  1. 登录RES管理控制台,在左侧导航栏中选择“推荐业务>自定义场景”,默认进入“自定义场景”列表。
  2. 在自定义场景列表中,单击右上角“创建自定义场景,进入“创建自定义场景”页面。
  3. 在创建自定义场景页面,填写“基本信息”相关参数,基本信息包含场景名称、数据源、场景规格等关键信息,详情请参见表1
  4. 基本信息配置完成后单击“创建并下一步:召回策略”
    图1 自定义场景基本信息
    表1 自定义场景基本信息参数说明

    参数名称

    子参数

    说明

    基本信息

    场景名称

    自定义场景的名称。只能包含数字、大小写字母、下划线和中划线,长度不能超过64位且不能为空。

    场景名称创建之后不支持修改。

    场景类型

    选择需要的场景类型。

    • “基于用户推荐物品”:某些用户的属性很相似,如电商平台根据这些用户的行为(浏览、点击、购买)计算与这些用户相似用户的行为,为该用户推荐相似用户浏览或购买的物品。
    • “基于用户推荐用户”:某些用户的属性很相似,如交友平台根据这些用户的行为(浏览、点击)或属性推荐与这些用户相似用户。
    • “基于物品推荐物品”:某些物品的属性、描述很相似,或者经常被一起浏览或购买。如媒资平台将会计算物品之间的相似或关联程度,当用户查看了某个物品的时候,会推荐最相似/最相关的物品。
    • “基于物品推荐用户”:某些物品的属性、描述很相似,或者经常被一起购买。如房产平台会计算物品之间的相似或关联程度,当用户查看某个物品的时候,会推荐同时拥有该类型房源的房产经纪人。

    服务类型

    选择您需要的服务类型。

    • “推荐引擎”:推荐引擎用于对RES召回策略生成的候选集结果进行融合过滤和排序。
    • “排序引擎”:排序引擎无需配置召回策略,允许用户提供自己的候选集,使用RES的排序策略进行排序。

    数据源

    从右侧下拉框中选择RES系统中已有的数据源。当无可用数据源时,此下拉框为空。

    数据区间

    时间单位

    支持天和小时。

    数据选择

    指定历史行为时间段,选取数据中最靠后的时间往前N天或N小时的行为数据计算用户偏好。

    物品类别

    是否需要根据category值对原始数据进行过滤。如新闻网站,category取值可能为娱乐、体育、时事等

    设置黑名单

    设置黑名单列表。后续任务读取数据时,将会过滤掉指定的用户或物品的记录。文件格式为每个ID占据一行。

    用户黑名单/物品黑名单

    上传设置的黑名单列表。

    场景规格

    离线计算规格

    可选择“4CU”“8CU”“16CU”“32CU”四种规格。其中,CU代表CPU核数。

    实时计算规格

    可选择“2CU”“4CU”“8CU”“16CU”四种规格。其中,CU代表CPU核数。

    排序模型训练规格

    可选择“GPU-P100”“8CU”其中,CU代表CPU核数。

    在线并发规格

    在线服务获取推荐的最高调用次数,单位为次每秒,默认为5,取值范围为5-500

召回策略

您可以根据业务需要,选择合适的召回策略。召回策略用于配置离线计算逻辑,通过启动离线计算任务进行候选推荐结果集的生成。

各个召回策略的详细介绍请参见:

  1. “创建自定义场景”页面,进入“召回策略”页签,单击“添加召回策略”,根据业务需要在下拉框中选择一个合适的策略。本章节以“基于交替最小二乘的矩阵分解推荐”为例进行创建,如图2所示。
    图2 召回策略
    表2 基于交替最小二乘的矩阵分解推荐参数说明

    参数

    说明

    名称

    根据业务自定义命名。

    描述

    根据业务自定义。例如,这是一个测试策略。

    隐向量维度

    在ALS算法中使用,指定用户隐向量、物品隐向量的隐含因子的维度大小。如果离线计算失败,建议调小至10以下。

    默认为10。

    优化正则化系数

    在ALS算法中使用,指定用户隐向量、物品隐向量的隐含因子的维度大小。

    设置为默认参数0.01。

    最大迭代次数

    指定迭代优化的最大迭代次数。如果离线计算失败,建议调小至10以下。

    默认为10。

    最大推荐结果数

    最多生成多少个推荐结果。

    默认参数100。

    开启调度

    开启调度,按照指定的调度策略定期执行作业。

    • “调度周期”:调度周期可选“天”“周”
    • “调度类型”:包括自定义和间隔调度。
    • “开始调度时间”:选择具体的调度时间。当调度周期选择为“周”时,可在此下拉框中勾选星期一到星期天的任一天进行调度。
    • “时间间隔”:如果选择的调度类型为间隔调度,需要配置调度的时间间隔。
  2. 创建完成后单击“确认”。保存后的召回策略会展示在下面的列表中。
  3. (可选)在目标召回策略右侧,可以对所选策略进行“编辑”“删除”操作。

    删除操作不可恢复,请您谨慎操作。

  4. 具体策略的参数说明可单击上方策略名称进行查看,策略设置完成后,单击“下一步:过滤规则”

过滤规则

过滤规则是用于配置候选集的过滤方式,使相关内容不进入候选集。

  • 如果您选择的是排序引擎,在配置完基本信息之后进入“过滤规则”页签。
  • 如果您选择的是推荐引擎,在配置完召回策略之后,进入“过滤规则”页签。
  1. “创建自定义场景”页面,进入“过滤规则”页签,单击“添加过滤策略”,如图3所示。策略的详细参数说明请参见过滤规则
    图3 创建过滤规则
    表3 过滤规则参数说明

    参数

    说明

    名称

    根据业务自定义命名。

    描述

    根据业务自定义描述。

    频次

    筛选出每个用户的行为数据中满足要求的数据,使之不进入候选集。

    • 相对时间间隔:与数据源内的行为数据记录最后的一条时间相差天数。
    • 最小次数:某用户对某物品产生某行为的最小次数。
    • 行为类型:指定行为类型。
    • 绝对时间间隔:与当前时间相差天数。
    • 最大次数:某用户对某物品产生某行为的最大次数。

    行为过滤逻辑

    设置为AND或者OR。AND即为在7天内点赞超过3次且在7天内消费超过3次的物品。

    开启调度

    开启调度,按照指定的调度策略定期执行作业。

    • “调度周期”:调度周期可选“天”“周”
    • “调度类型”:包括自定义和间隔调度。
    • “开始调度时间”:选择具体的调度时间。当调度周期选择为“周”时,可在此下拉框中勾选星期一到星期天的任一天进行调度。
    • “时间间隔”:如果选择的调度类型为间隔调度,需要配置调度的时间间隔。
  2. 创建完成后单击“确认”。保存后的策略会展示在下面的列表中。
  3. (可选)在目标策略右侧,可以对所选策略进行“编辑”“删除”操作。
  4. 具体策略的参数说明可单击上方策略名称进行查看,策略设置完成后,单击“下一步:排序策略”

排序策略-离线特征工程

在进行排序之前需要先进行离线特征工程将数据转化为排序所需要的格式。

  1. “创建自定义场景”页面,进入“排序策略”页签,如图4所示。策略的详细参数说明请参见排序策略-离线特征工程
    图4 离线特征工程
  2. 创建完成后单击“确认”。保存后的策略会展示在下面的列表中。
  3. (可选)在目标策略右侧,可以对所选策略进行“编辑”“删除”操作。
  4. 具体策略的参数说明可单击上方策略名称进行查看。

排序策略-离线排序策略

排序策略离线排序策略是用于对召回策略生成的候选集进行二次排序。如果离线使用排序模型,需在排序策略-离线特征工程中创建完成后才可以正常使用排序策略。

各个策略的详细参数设置和输入输出请单击下方链接查看。

  1. “创建自定义场景”页面,进入“排序策略”页签,单击“离线排序策略”,如图5所示。用户可以根据业务需要在“添加排序策略”下拉框中选择一个合适的排序策略。
    图5 添加离线排序策略
  2. 创建完成后在单击“确认”。保存后的策略会展示在下面的列表中。
  3. (可选)在目标策略右侧,可以对所选策略进行“编辑”“删除”操作。
  4. 具体策略的参数说明可单击上方策略名称进行查看。

排序策略-近线特征工程

近线特征工程是对近线数据进行特征处理,以便生成特征数据用于排序。必须先完成离线排序模型相关操作才可进行此配置。

近线特征工程默认为关闭状态,您可以在创建近线特征工程右侧单击按钮,在弹出的对话框中单击“是”进行创建。

排序策略-近线排序策略

近线排序策略用于对在线实时数据排序。如果使用在线排序模型,需在排序策略-近线特征工程中创建完成后才可以正常使用排序策略。

  1. “创建自定义场景”页面,进入“排序策略”页签,单击“添加近线排序策略”
  2. 进行在线学习参数配置。
  3. 创建完成后在单击“确认”。保存后的策略会展示在下面的列表中。
  4. (可选)在目标策略右侧,可以对所选策略进行“编辑”“删除”操作。
  5. 参数配置完成后可单击“下一步:在线服务”

在线服务

  1. “在线服务”页面,填写基本信息。您可以根据实际情况填写“名称”“描述”信息或“开启异常告警”。单击开启异常告警,在下拉选项中选择SMN主题名称。如果您还未有可选的主题,请前往消息通知服务创建主题
  2. 单击“添加在线流程”,并进行命名,您最多可以部署5个在线流程。根据选择的服务类型配置在线流程,包括“召回池”“过滤”“排序”等关键信息。具体参数信息参见表1
    图7 创建在线服务
  3. 参数配置完成后单击“创建并完成”。作业创建完成后您可以在自定义场景列表页面目标场景的“操作”列单击“执行”,待场景状态为“运行中”时,作业运行完成。

(可选)效果评估

自定义场景创建完成后,页面自动跳转到自定义场景列表页面,您可以单击目标场景名称进入详情页,创建效果评估。

  1. “效果评估”页签下单击,在弹出页面选择填写“名称”“描述”
    • 效果评估名称:只能由字母、数字、中划线和下划线组成,并且长度小于64个字符。
      图8 创建效果评估
  2. 配置创建效果评估相关参数,请参见表1
  3. 配置完成后单击“确认”,该作业会出现在效果评估页签下的列表中。鼠标移动至该策略上方,可以对该策略作业进行“编辑”“查看”“执行”“删除”操作。
  4. 您可以在自定义详情页面查看“已完成”状态的评估结果图表,方便您查看近期的评估效果。

相关文档