网络
虚拟私有云 VPC
弹性公网IP EIP
弹性负载均衡 ELB
NAT网关 NAT
云专线 DC
虚拟专用网络 VPN
云连接 CC
VPC终端节点 VPCEP
企业路由器 ER
企业交换机 ESW
全球加速 GA
企业连接 EC
云原生应用网络 ANC
安全与合规
安全技术与应用
Web应用防火墙 WAF
企业主机安全 HSS
云防火墙 CFW
安全云脑 SecMaster
DDoS防护 AAD
数据加密服务 DEW
数据库安全服务 DBSS
云堡垒机 CBH
数据安全中心 DSC
云证书管理服务 CCM
威胁检测服务 MTD
态势感知 SA
认证测试中心 CTC
边缘安全 EdgeSec
应用中间件
微服务引擎 CSE
分布式消息服务Kafka版
分布式消息服务RabbitMQ版
分布式消息服务RocketMQ版
API网关 APIG
分布式缓存服务 DCS
多活高可用服务 MAS
事件网格 EG
管理与监管
统一身份认证服务 IAM
消息通知服务 SMN
云监控服务 CES
应用运维管理 AOM
应用性能管理 APM
云日志服务 LTS
云审计服务 CTS
标签管理服务 TMS
配置审计 Config
应用身份管理服务 OneAccess
资源访问管理 RAM
组织 Organizations
资源编排服务 RFS
优化顾问 OA
IAM 身份中心
云运维中心 COC
资源治理中心 RGC
解决方案
高性能计算 HPC
SAP
混合云灾备
开天工业工作台 MIW
Haydn解决方案工厂
数字化诊断治理专家服务
云生态
云商店
合作伙伴中心
华为云开发者学堂
华为云慧通差旅
开发与运维
软件开发生产线 CodeArts
需求管理 CodeArts Req
流水线 CodeArts Pipeline
代码检查 CodeArts Check
编译构建 CodeArts Build
部署 CodeArts Deploy
测试计划 CodeArts TestPlan
制品仓库 CodeArts Artifact
移动应用测试 MobileAPPTest
CodeArts IDE Online
开源镜像站 Mirrors
性能测试 CodeArts PerfTest
应用管理与运维平台 ServiceStage
云应用引擎 CAE
开源治理服务 CodeArts Governance
华为云Astro轻应用
CodeArts IDE
Astro工作流 AstroFlow
代码托管 CodeArts Repo
漏洞管理服务 CodeArts Inspector
联接 CodeArtsLink
软件建模 CodeArts Modeling
Astro企业应用 AstroPro
CodeArts盘古助手
华为云Astro大屏应用
计算
弹性云服务器 ECS
Flexus云服务
裸金属服务器 BMS
云手机服务器 CPH
专属主机 DeH
弹性伸缩 AS
镜像服务 IMS
函数工作流 FunctionGraph
云耀云服务器(旧版)
VR云渲游平台 CVR
Huawei Cloud EulerOS
云化数据中心 CloudDC
网络
虚拟私有云 VPC
弹性公网IP EIP
弹性负载均衡 ELB
NAT网关 NAT
云专线 DC
虚拟专用网络 VPN
云连接 CC
VPC终端节点 VPCEP
企业路由器 ER
企业交换机 ESW
全球加速 GA
企业连接 EC
云原生应用网络 ANC
CDN与智能边缘
内容分发网络 CDN
智能边缘云 IEC
智能边缘平台 IEF
CloudPond云服务
安全与合规
安全技术与应用
Web应用防火墙 WAF
企业主机安全 HSS
云防火墙 CFW
安全云脑 SecMaster
DDoS防护 AAD
数据加密服务 DEW
数据库安全服务 DBSS
云堡垒机 CBH
数据安全中心 DSC
云证书管理服务 CCM
威胁检测服务 MTD
态势感知 SA
认证测试中心 CTC
边缘安全 EdgeSec
大数据
MapReduce服务 MRS
数据湖探索 DLI
表格存储服务 CloudTable
可信智能计算服务 TICS
推荐系统 RES
云搜索服务 CSS
数据可视化 DLV
数据接入服务 DIS
数据仓库服务 GaussDB(DWS)
数据治理中心 DataArts Studio
湖仓构建 LakeFormation
智能数据洞察 DataArts Insight
应用中间件
微服务引擎 CSE
分布式消息服务Kafka版
分布式消息服务RabbitMQ版
分布式消息服务RocketMQ版
API网关 APIG
分布式缓存服务 DCS
多活高可用服务 MAS
事件网格 EG
开天aPaaS
应用平台 AppStage
开天企业工作台 MSSE
开天集成工作台 MSSI
API中心 API Hub
云消息服务 KooMessage
交换数据空间 EDS
云地图服务 KooMap
云手机服务 KooPhone
组织成员账号 OrgID
云空间服务 KooDrive
管理与监管
统一身份认证服务 IAM
消息通知服务 SMN
云监控服务 CES
应用运维管理 AOM
应用性能管理 APM
云日志服务 LTS
云审计服务 CTS
标签管理服务 TMS
配置审计 Config
应用身份管理服务 OneAccess
资源访问管理 RAM
组织 Organizations
资源编排服务 RFS
优化顾问 OA
IAM 身份中心
云运维中心 COC
资源治理中心 RGC
区块链
区块链服务 BCS
数字资产链 DAC
华为云区块链引擎服务 HBS
解决方案
高性能计算 HPC
SAP
混合云灾备
开天工业工作台 MIW
Haydn解决方案工厂
数字化诊断治理专家服务
价格
成本优化最佳实践
专属云商业逻辑
云生态
云商店
合作伙伴中心
华为云开发者学堂
华为云慧通差旅
其他
管理控制台
消息中心
产品价格详情
系统权限
客户关联华为云合作伙伴须知
公共问题
宽限期保留期
奖励推广计划
活动
云服务信任体系能力说明
开发与运维
软件开发生产线 CodeArts
需求管理 CodeArts Req
流水线 CodeArts Pipeline
代码检查 CodeArts Check
编译构建 CodeArts Build
部署 CodeArts Deploy
测试计划 CodeArts TestPlan
制品仓库 CodeArts Artifact
移动应用测试 MobileAPPTest
CodeArts IDE Online
开源镜像站 Mirrors
性能测试 CodeArts PerfTest
应用管理与运维平台 ServiceStage
云应用引擎 CAE
开源治理服务 CodeArts Governance
华为云Astro轻应用
CodeArts IDE
Astro工作流 AstroFlow
代码托管 CodeArts Repo
漏洞管理服务 CodeArts Inspector
联接 CodeArtsLink
软件建模 CodeArts Modeling
Astro企业应用 AstroPro
CodeArts盘古助手
华为云Astro大屏应用
存储
对象存储服务 OBS
云硬盘 EVS
云备份 CBR
高性能弹性文件服务 SFS Turbo
弹性文件服务 SFS
存储容灾服务 SDRS
云硬盘备份 VBS
云服务器备份 CSBS
数据快递服务 DES
云存储网关 CSG
专属分布式存储服务 DSS
数据工坊 DWR
地图数据 MapDS
键值存储服务 KVS
容器
云容器引擎 CCE
云容器实例 CCI
容器镜像服务 SWR
云原生服务中心 OSC
应用服务网格 ASM
华为云UCS
数据库
云数据库 RDS
数据复制服务 DRS
文档数据库服务 DDS
分布式数据库中间件 DDM
云数据库 GaussDB
云数据库 GeminiDB
数据管理服务 DAS
数据库和应用迁移 UGO
云数据库 TaurusDB
人工智能
AI开发平台ModelArts
华为HiLens
图引擎服务 GES
图像识别 Image
文字识别 OCR
自然语言处理 NLP
内容审核 Moderation
图像搜索 ImageSearch
医疗智能体 EIHealth
企业级AI应用开发专业套件 ModelArts Pro
人脸识别服务 FRS
对话机器人服务 CBS
语音交互服务 SIS
人证核身服务 IVS
视频智能分析服务 VIAS
城市智能体
自动驾驶云服务 Octopus
盘古大模型 PanguLargeModels
IoT物联网
设备接入 IoTDA
全球SIM联接 GSL
IoT数据分析 IoTA
路网数字化服务 DRIS
IoT边缘 IoTEdge
设备发放 IoTDP
企业应用
域名注册服务 Domains
云解析服务 DNS
企业门户 EWP
ICP备案
商标注册
华为云WeLink
华为云会议 Meeting
隐私保护通话 PrivateNumber
语音通话 VoiceCall
消息&短信 MSGSMS
云管理网络
SD-WAN 云服务
边缘数据中心管理 EDCM
云桌面 Workspace
应用与数据集成平台 ROMA Connect
ROMA资产中心 ROMA Exchange
API全生命周期管理 ROMA API
政企自服务管理 ESM
视频
实时音视频 SparkRTC
视频直播 Live
视频点播 VOD
媒体处理 MPC
视频接入服务 VIS
数字内容生产线 MetaStudio
迁移
主机迁移服务 SMS
对象存储迁移服务 OMS
云数据迁移 CDM
迁移中心 MGC
专属云
专属计算集群 DCC
开发者工具
SDK开发指南
API签名指南
DevStar
华为云命令行工具服务 KooCLI
Huawei Cloud Toolkit
CodeArts API
云化转型
云架构中心
云采用框架
用户服务
账号中心
费用中心
成本中心
资源中心
企业管理
工单管理
客户运营能力
国际站常见问题
支持计划
专业服务
合作伙伴支持计划
我的凭证
华为云公共事业服务云平台
工业软件
工业数字模型驱动引擎
硬件开发工具链平台云服务
工业数据转换引擎云服务

召回策略

更新时间:2024-04-17 GMT+08:00
分享

召回是指对大量的物品做初选,为每一个用户形成个性化侯选集。召回策略中内置了多种召回方式,用户可根据自己场景选择。召回策略对应流程请参见图1

图1 召回策略

推荐系统支持的召回方式有:

创建召回策略

“创建召回策略”页面,您可以对目标数据选择不同策略进行离线计算,得到合适的候选集。

创建召回策略操作步骤如下:

  1. “离线作业”下,单击“召回策略”页签,单击上方“创建”,进入“创建召回策略”页面。
  2. “创建召回策略”页面,填写召回策略“名称”“场景”“描述”
    • 召回策略名称:请以“Retrieval-”开始,只能由字母、数字、中划线和下划线组成,并且长度小于64个字符。
    • “场景”信息可选择您在全局配置页面创建的场景。
  3. 设置计算引擎和信息,指定“服务名”“集群名称”“任务配置地址”“资源规格”等信息。
  4. 单击“添加召回策略”,根据业务需要在下拉框中选择一个合适的策略。具体策略参数说明请单击上方策略名称查看。
    图2 添加召回策略
  5. (可选)在目标召回策略右侧,单击“查看输入输出”,可以查看输入数据和输出数据。
  6. (可选)在目标召回策略右侧,单击“设置参数”,可以对所选策略进行参数设置。
  7. (可选)在目标召回策略右侧,单击“删除”,可以删除该策略。
  8. 策略设置完成后,单击“确定”。作业一般需要运行一段时间,根据您的数据量和资源不同,训练时间将耗时几分钟到几十分钟不等,请您耐心等待。

    您可以前往召回策略列表,查看作业的基本情况。在作业列表中,刚创建的作业“状态”“计算中”,当作业“状态”变为“计算成功”时,表示作业运行结束,生成的候选集ID将使用于在线服务,为用户生成推荐列表。当作业“状态”变为“计算失败”时,您可以单击作业的名称,进入详情页面,通过查看日志等手段处理问题。

基于特定行为热度推荐

基于特定行为热度推荐通过统计用户操作行为表中物品发生某行为的次数,按照次数从高到低返回物品列表。比如可以统计物品被购买的次数,而返回被购买次数最高的若干个物品。
表1 参数说明

参数名称

说明

默认值

策略别名

策略显示名称,由中文、英文、数字、下划线、空格或者中划线组成,并且不能以空格开始和结束,长度为1~60个字符。

默认召回策略的名称

数据源

数据源类型有初始格式和通用格式2种可选。

初始格式
  • 用户操作行为表:单击选择OBS中存储的用户操作行为表。当选择数据格式为csv时,根据情况单击设置数据参数。
通用格式
  • 通用格式数据:特征工程“初始用户画像-物品画像-标准宽表生成”算子生成的用户推荐系统的数据。从用户特征表、物品特征表以及用户行为表中提取用户、物品特征和用户行为,并生成json数据,即内部通用格式。

默认选择初始格式

时间选择

时间选择包括数据时间和行为时间跨度。

  • 数据时间:用于匹配在起始时间和终止时间内的行为数据。
  • 行为时间跨度:指定历史行为时间段,选取数据中最靠后的时间往前N天的行为数据计算用户偏好。建议至少设置30天。

默认选择数据时间的当月所有数据

行为类型

在特定行为热度策略中使用,选择一种行为类型后基于该种行为热度进行推荐。

用户行为包含如下几种类型:

  • view:物品曝光
  • click:用户点击物品
  • collect:用户收藏了某个物品
  • uncollect:用户取消收藏某个物品
  • search_click:用户点击搜索结果中的物品
  • comment:用户对物品的评论
  • share:分享
  • like:点赞
  • dislike:点衰
  • grade:评分
  • consume:消费
  • use:观看视频/听音乐/阅读。

物品曝光

行为次数统计方法

统计物品记录数的方式。

  • pv:page view,即页面浏览量或点击量。
  • uv:unique visitor,即同一个访客只记录一条数据。

默认pv

排序算法类型

物品热度是否随着时间衰减。

  • 不衰减:normal。
  • 衰减:time。

不衰减

最大推荐结果数

最多生成多少个推荐结果。

该参数会运用在“输出数据”的推荐候选集上。

100

表2 输入数据

数据

是否必须

描述

USER_BEHAVIOR

用户操作行为表。

表3 输出数据

名称

类型

描述

HOT_REC_OFFLINE_CANDIDATES

CANDIDATES_SET

特定行为热度推荐算法生成的候选集。

基于综合行为热度推荐

基于综合行为热度推荐与基于特定行为热度推荐的召回原理大体相同,不同点是用统计几种行为的加权热度代替了特定行为热度。
表4 参数说明

参数名称

说明

默认值

策略别名

策略显示名称,由中文、英文、数字、下划线、空格或者中划线组成,并且不能以空格开始和结束,长度为1~60个字符。

默认召回策略的名称

扩展功能

组合作业的资源选择数据源类型为“通用格式”时,会出现扩展功能选项。

创建“基于综合行为热度推荐”的召回策略时,当开启扩展功能,数据源类型仅支持通用格式。

该功能表名是否使用分组推荐功能,根据全局特征信息文件勾选的用户特征或物品特征进行分组。

  • 扩展功能开启:
  • 扩展功能关闭:

默认关闭

数据源

数据源类型有初始格式和通用格式2种可选。

初始格式
  • 用户操作行为表:初始单击选择OBS中存储的用户操作行为表。当选择数据格式为csv时,根据情况单击设置数据参数。
通用格式
  • 通用格式数据:特征工程“初始用户画像-物品画像-标准宽表生成”算子生成的用户推荐系统的数据。从用户特征表、物品特征表以及用户行为表中提取用户、物品特征和用户行为,并生成json数据,即内部通用格式。

默认选择初始格式

时间选择

时间选择包括数据时间和行为时间跨度。

  • 数据时间:用于匹配在起始时间和终止时间内的行为数据。
  • 行为时间跨度:指定历史行为时间段,选取数据中最靠后的时间往前N天的行为数据计算用户偏好。建议至少设置30天。

默认选择数据时间的当月所有数据

行为权重

当用户行为信息中存在多种行为类型时,可通过指定行为的权重,来统一量化行为类型对应的评分。

用户行为权重包含:

  • view:物品曝光
  • click:用户点击物品
  • collect:用户收藏了某个物品
  • uncollect:用户取消收藏某个物品
  • search_click:用户点击搜索结果中的物品
  • comment:用户对物品的评论
  • share:分享
  • like:点赞
  • dislike:点衰
  • grade:评分
  • consume:消费
  • use:观看视频/听音乐/阅读

您可以单击“增加行为权重”,新增一个行为权重。通过来自定义权重大小。

单击可以删除对应行的行为权重。

物品曝光 1.0

全局特征信息文件

开启扩展功能时,此配置项生效。其中“数据源类型”您可以选择“用户特征”或者“物品特征”进行设置。

  • 全局特征信息文件:单击选择该文件的OBS存储路径,当涉及更新时,单击更新全局特征信息文件,并重新设置依赖此文件的配置项。
  • 用户特征:从下拉选项中勾选全局特征信息文件中提取的用户特征用于进行分组推荐。
  • 物品特征:从下拉选项中勾选全局特征信息文件中提取的物品特征用于进行分组推荐。

-

行为次数统计方法

统计物品记录数的方式。

  • pv:page view,即页面浏览量或点击量。
  • uv:unique visitor,即同一个访客只记录一条数据。

默认pv

排序算法类型

物品热度是否随着时间衰减。

  • 不衰减:normal。
  • 衰减:time。

不衰减

最大推荐结果数

最多生成多少个推荐结果。

该参数会运用在“输出数据”的推荐候选集上。

100

表5 输入数据

数据

是否必须

描述

USER_BEHAVIOR

用户操作行为表。

表6 输出数据

名称

类型

描述

WEIGHT_BEHAVIORS_REC_OFFLINE_CANDIDATES

CANDIDATES_SET

综合行为热度推荐算法生成的候选集。

基于物品的协同过滤推荐

采用经典推荐算法基于物品的协同过滤ItemCF进行召回。
表7 参数说明

参数名称

说明

默认值

策略别名

策略显示名称,由中文、英文、数字、下划线、空格或者中划线组成,并且不能以空格开始和结束,长度为1~60个字符。

默认召回策略的名称

数据源

数据源类型有初始格式和通用格式2种可选。

初始格式
  • 用户操作行为表:单击选择OBS中存储的用户操作行为表。当选择数据格式为csv时,根据情况单击设置数据参数。
通用格式
  • 通用格式数据:特征工程“初始用户画像-物品画像-标准宽表生成”算子生成的用户推荐系统的数据。从用户特征表、物品特征表以及用户行为表中提取用户、物品特征和用户行为,并生成json数据,即内部通用格式。
  • 通用格式时间:用户行为数据时间范围,可只有起始时间、结束时间或为空。

默认选择初始格式

行为时间跨度(天)

指定历史行为时间段,选取数据中最靠后的时间往前N天的行为数据计算用户偏好。建议至少设置30天。

30天

行为权重

当用户行为信息中存在多种行为类型时,可通过指定行为的权重,来统一量化行为类型对应的评分。

用户行为权重项包含如下几种类型:

  • view:物品曝光
  • click:用户点击物品
  • collect:用户收藏了某个物品
  • search_click:用户点击搜索结果中的物品
  • comment:用户对物品的评论
  • share:分享
  • like:点赞
  • grade:评分
  • consume:消费
  • use:观看视频/听音乐/阅读。

您可以单击“增加行为权重”,新增一个行为权重。通过来自定义权重大小。

单击可以删除对应行的行为权重。

物品曝光;1.0

物品最近邻域数

在ItemCF算法中使用,指定某个物品的若干个最近邻物品,构成该物品近邻集合。

50

相似性度量方式

计算用户或物品特征表达相似性的方式。在ItemCF算法中,每个物品会基于对它有过行为的用户表示为特征向量,向量每一维是一个<user_id, score>元组,score表示对应user_id的权重,该参数决定了使用何种函数计算物品向量之间的相似度。

相似性度量支持如下方式:

基于余弦夹角的相似性计算

行数

用于筛选物品最近邻域的条件组合参数。该值越大,筛选条件越严格。

5

条数

用于筛选物品最近邻域的条件组合参数。该值越小,筛选条件越严格。

4

最大推荐结果数

最多生成多少个推荐结果。

该参数会运用在“输出数据”的推荐候选集上。

100

表8 输入数据

数据

是否必须

描述

USER_BEHAVIOR

用户操作行为表。

表9 输出数据

名称

类型

描述

ITEMCF_REC_OFFLINE_CANDIDATES

CANDIDATES_SET

ItemCF算法生成的用户-物品列表候选集。

ITEMCF_REC_OFFLINE_CANDIDATES

CANDIDATES_SET

ItemCF算法生成的物品-物品列表候选集。

基于用户的协同过滤推荐

采用经典算法基于用户的协同过滤(UserCF)进行召回。
表10 参数说明

参数名称

说明

默认值

策略别名

策略显示名称,由中文、英文、数字、下划线、空格或者中划线组成,并且不能以空格开始和结束,长度为1~60个字符。

默认召回策略的名称

数据源

数据源类型有初始格式和通用格式2种可选。

初始格式
  • 用户操作行为表:单击选择OBS中存储的用户操作行为表。当选择数据格式为csv时,根据情况单击设置数据参数。
通用格式
  • 通用格式数据:特征工程“初始用户画像-物品画像-标准宽表生成”算子生成的用户推荐系统的数据。从用户特征表、物品特征表以及用户行为表中提取用户、物品特征和用户行为,并生成json数据,即内部通用格式。

默认选择初始格式

行为时间跨度(天)

指定历史行为时间段,选取数据中最靠后的时间往前N天的行为数据计算用户偏好。建议至少设置30天。

30天

行为权重

当用户行为信息中存在多种行为类型时,可通过指定行为的权重,来统一量化行为类型对应的评分。

用户行为权重项包含如下几种类型:

  • view:物品曝光
  • click:用户点击物品
  • collect:用户收藏了某个物品
  • search_click:用户点击搜索结果中的物品
  • comment:用户对物品的评论
  • share:分享
  • like:点赞
  • grade:评分
  • consume:消费
  • use:观看视频/听音乐/阅读。

您可以单击“增加行为权重”,新增一个行为权重。通过来自定义权重大小。

单击可以删除对应行的行为权重。

物品曝光 1.0

用户最近邻域数

在UserCF算法中使用,指定某个用户的若干个最近邻用户,构成该用户近邻集合。

50

相似性度量方式

请参见表7中说明。

基于余弦夹角的相似性计算

行数

用于筛选用户最近邻域的条件组合参数。该值越大,筛选条件越严格。

5

条数

用于筛选用户最近邻域的条件组合参数。该值越小,筛选条件越严格。

4

最大推荐结果数

最多生成多少个推荐结果。

该参数会运用在“输出数据”的推荐候选集上。

100

表11 输入数据

数据

是否必须

描述

USER_BEHAVIOR

用户操作行为表。

表12 输出数据

名称

类型

描述

USERCF_REC_OFFLINE_CANDIDATES

CANDIDATES_SET

UserCF算法生成的用户-物品列表候选集。

基于交替最小二乘的矩阵分解推荐

基于交替最小二乘的矩阵分解推荐:基于用户-物品的行为信息作为原始矩阵,利用ALS优化算法对原始矩阵进行矩阵分解,分解之后的用户隐向量矩阵和物品隐向量矩阵可以用来生成预估的新的用户-物品评分矩阵,提取出评分最高的若干个物品作为召回结果。
表13 参数说明

参数名称

说明

默认值

策略别名

策略显示名称,由中文、英文、数字、下划线、空格或者中划线组成,并且不能以空格开始和结束,长度为1~60个字符。

默认召回策略的名称

数据源

数据源类型有初始格式和通用格式2种可选。

初始格式
  • 用户操作行为表:单击选择OBS中存储的用户操作行为表。当选择数据格式为csv时,根据情况单击设置数据参数。
通用格式
  • 通用格式数据:特征工程“初始用户画像-物品画像-标准宽表生成”算子生成的用户推荐系统的数据。从用户特征表、物品特征表以及用户行为表中提取用户、物品特征和用户行为,并生成json数据,即内部通用格式。

默认选择初始格式

行为时间跨度(天)

指定历史行为时间段,选取数据中最靠后的时间往前N天的行为数据计算用户偏好。建议至少设置30天。

30天

行为权重

当用户行为信息中存在多种行为类型时,可通过指定行为的权重,来统一量化行为类型对应的评分。

用户行为权重项包含如下几种类型:

  • view:物品曝光
  • click:用户点击物品
  • collect:用户收藏了某个物品
  • search_click:用户点击搜索结果中的物品
  • comment:用户对物品的评论
  • share:分享
  • like:点赞
  • grade:评分
  • consume:消费
  • use:观看视频/听音乐/阅读。

您可以单击“增加行为权重”,新增一个行为权重。通过来自定义权重大小。

单击可以删除对应行的行为权重。

物品曝光 1.0

隐向量维度

在ALS算法中使用,指定用户隐向量、物品隐向量的隐含因子的维度大小。如果离线计算失败,建议调小至10以下。

10

最大迭代次数

指定迭代优化的最大迭代次数。如果离线计算失败,建议调小至10以下。

10

正则化系数

在ALS算法中使用,指定正则化系数,作为优化目标中参数项代价的系数,用于避免过拟合现象发生。

0.01

最大推荐结果数

最多生成多少个推荐结果。

该参数会运用在“输出数据”的推荐候选集上。

100

表14 输入数据

数据

是否必须

描述

USER_BEHAVIOR

用户操作行为表。

表15 输出数据

名称

类型

描述

ALSCF_REC_OFFLINE_UIREC_CANDIDATES

CANDIDATES_SET

AlsCF算法生成的用户-物品列表候选集。

业务规则-基于历史行为记忆生成候选集

业务规则-基于历史行为记忆生成候选集可以从用户历史行为数据中筛选出发生过某些行为的物品(例如,筛选出曾经点击过5次的物品)。此策略适用于“看了又看”,“买了又买”等推荐场景。
表16 参数说明

参数名称

说明

默认值

策略别名

策略显示名称,由中文、英文、数字、下划线、空格或者中划线组成,并且不能以空格开始和结束,长度为1~60个字符。

默认召回策略的名称

数据源

数据源类型有初始格式和通用格式2种可选。

初始格式
  • 用户操作行为表:单击选择OBS中存储的用户操作行为表。当选择数据格式为csv时,根据情况单击设置数据参数。
通用格式
  • 通用格式数据:特征工程“初始用户画像-物品画像-标准宽表生成”算子生成的用户推荐系统的数据。从用户特征表、物品特征表以及用户行为表中提取用户、物品特征和用户行为,并生成json数据,即内部通用格式。

默认选择初始格式

行为时间跨度(天)

指定历史行为时间段,选取数据中最靠后的时间往前N天的行为数据计算用户偏好。建议至少设置30天。

30天

行为类型

默认物品曝光,配置参数请参见表1中说明。

物品曝光;1次

最大推荐结果数

最多生成多少个推荐结果。

该参数会运用在“输出数据”的推荐候选集上。

100

表17 输入数据

数据

是否必须

描述

USER_BEHAVIOR

用户操作行为表。

表18 输出数据

名称

类型

描述

CUSTOMRULE_REC_OFFLINE_UIREC_CANDIDATES

CANDIDATES_SET

CustomRule生成的用户-物品列表候选集。

业务规则-人工导入

业务规则-人工导入是指用户自定义物品列表,并将此列表排序后作为候选集,以供在线服务调用。
表19 参数说明

参数名称

说明

策略名

策略显示名称,由中文、英文、数字、下划线、空格或者中划线组成,并且不能以空格开始和结束,长度为1~60个字符。默认召回策略的名称。

OBS地址

用户可从此OBS地址中选择自定义物品列表。

输入数据

数据格式(.csv文件):

itemId1,score1

itemId2,score2

itemId为物品id,score为物品分数。score不是必选,如果不选则算法默认给物品分配分数。算法将物品列表根据分数排序后作为候选集

用户可从OBS中选择保存有人工编辑推荐结果的列表(即物品ID)。

表20 输出数据

名称

类型

描述

MANUALRULE_REC_OFFLINE_UIREC_CANDIDATES

CANDIDATES_SET

人工编辑候选集。

例如,127,1

基于属性匹配的召回策略

基于属性匹配的召回策略会用用户画像和物品画像的相关属性进行匹配,为用户召回属性匹配程度高的若干个物品。

表21 参数说明

参数名称

说明

默认值

策略别名

策略显示名称,由中文、英文、数字、下划线、空格或者中划线组成,并且不能以空格开始和结束,长度为1~60个字符。

默认召回策略的名称。

全局特征信息文件

用户在使用近线策略之前,需要提供全局特征信息文件,该文件中包含了离线数据中用户、物品的所有特征字段及对应数据类型,并且特征类型要始终保持一致。全局特征信息文件示例请参考全局特征信息文件

-

匹配类型

画像匹配类型,包括:

  • 用户匹配物品
  • 物品匹配用户
  • 用户自匹配
  • 物品自匹配

用户匹配物品

匹配特征对

用户和物品相关联特征。请根据实际情况配置参数,如果属性匹配特征对相似度较高内存不够时需提升配置。您可以单击进入“添加匹配特征对”页面进行配置。设置特征对的别名、根据全局特征信息文件匹配用户特征名和物品特征名,设置权重。

-

推荐个数

推荐给用户的物品最大个数。

10

行数

该值越大筛选相似项条件越严格。

5

条数

该值越小筛选相似项条件越严格。

4

用户画像存储

该数据来源于基于用户数据更新用户画像更新后的用户画像数据或者初始用户画像-物品画像-标准宽表生成的用户画像。

-

物品画像存储

该数据来源于基于物品数据更新物品画像更新后的物品画像数据或者初始用户画像-物品画像-标准宽表生成的物品画像。

-

最大推荐结果数

最多生成多少个推荐结果。

该参数会运用在“输出数据”的推荐候选集上。

100

基于UCB算法的推荐

基于UCB算法的推荐综合考虑了用户操作行为表中,物品发生的某几种行为类型及次数,然后给每一个物品都计算一个得分,最终返回得分最高的若干个物品。
表22 参数说明

参数名称

说明

默认值

策略别名

策略显示名称,由中文、英文、数字、下划线、空格或者中划线组成,并且不能以空格开始和结束,长度为1~60个字符。

默认召回策略的名称

数据源

数据源类型有初始格式和通用格式2种可选。

初始格式
  • 用户操作行为表:单击选择OBS中存储的用户操作行为表。当选择数据格式为csv时,根据情况单击设置数据参数。
通用格式
  • 通用格式数据:特征工程“初始用户画像-物品画像-标准宽表生成”算子生成的用户推荐系统的数据。从用户特征表、物品特征表以及用户行为表中提取用户、物品特征和用户行为,并生成json数据,即内部通用格式。

默认选择初始格式

行为时间跨度(天)

指定历史行为时间段,选取数据中最靠后的时间往前N天的行为数据计算用户偏好。建议至少设置30天。

30天

行为权重

当用户行为信息中存在多种行为类型时,可通过指定行为的权重,来统一量化行为类型对应的评分。

用户行为权重项包含如下几种类型:

  • view:物品曝光
  • click:用户点击物品
  • collect:用户收藏了某个物品
  • search_click:用户点击搜索结果中的物品
  • comment:用户对物品的评论
  • share:分享
  • like:点赞
  • grade:评分
  • consume:消费
  • use:观看视频/听音乐/阅读。

您可以单击“增加行为权重”,新增一个行为权重。通过来自定义权重大小。

单击可以删除对应行的行为权重。

物品曝光 1.0

最小行为次数

在物品上产生过行为的最小用户数,其中一个用户在一个物品上只计算一次行为。

30

折中参数

令alpha为Exploration 和 Exploitation之间的折中参数,其取值范围为[0,1],alpha越趋近于0,则物品的得分对历史得分高的物品越有利,即 Exploitation。反之,alpha越趋近于1,则物品的得分越倾向于探索新物品,即Exploration。

0.5

最大推荐结果数

最多生成多少个推荐结果。

该参数会运用在“输出数据”的推荐候选集上。

100

表23 输入数据

数据

是否必须

描述

USER_BEHAVIOR

用户操作行为表。

表24 输出数据

名称

类型

描述

UCB_REC_OFFLINE_CANDIDATES

CANDIDATES_SET

UCB算法生成的候选集。

提示

您即将访问非华为云网站,请注意账号财产安全

文档反馈

文档反馈

意见反馈

0/500

标记内容

同时提交标记内容