本文导读

特定行为热度推荐
综合行为热度推荐
基于物品的协同过滤推荐
基于用户的协同过滤推荐
基于交替最小二乘的矩阵分解推荐
基于历史行为记忆生成候选集
人工录入生成候选集
基于属性匹配的召回策略
逻辑斯蒂回归
因子分解机
域感知因子分解机
深度网络因子分解机
核函数特征交互神经网络

展开导读

文档首页/ 推荐系统 RES/ API参考/ API（V1不推荐）/ 作业相关API/ 策略参数说明

策略参数说明

更新时间：2023-05-24 GMT+08:00

RES支持多种策略，本章介绍召回策略（recall）、排序策略（sorting）。具体描述请参见表1 策略类型说明。

表1 策略类型说明
strategy_type	name	algorithm_type
recall	特定行为热度推荐	SpecificBehavior
	综合行为热度推荐	BehaviorsWeight
	基于物品的协同过滤推荐	ItemCF
	基于用户的协同过滤推荐	UserCF
	基于交替最小二乘的矩阵分解推荐	AlsCF
	基于历史行为记忆生成候选集	HistoryBehaviorMemory
	人工录入生成候选集	ManualInput
sorting	逻辑斯蒂回归	LR
	因子分解机	FM
	域感知因子分解机	FFM
	深度网络因子分解机	DEEPFM
	核函数特征交互神经网络	PIN

特定行为热度推荐

表2 SpecificBehavior参数说明
参数名称	是否必选	参数类型	说明
data_source_config	是	JSON	请参见表3，数据源参数配置。
algorithm_config	是	JSON	算法参数配置。
candidate_set_config	是	JSON	请参见表4，候选集参数配置。

表3 data_source_config参数说明
参数名称	是否必选	参数类型	描述信息
behavior_type	是	String	行为类型。 view：物品曝光 click：用户点击物品 collect：用户收藏了某个物品 uncollect：用户取消收藏某个物品 search_click：用户点击搜索结果中的物品 comment：用户对物品的评论 share: 分享 like：点赞 dislike：点衰 grade：评分 consume：消费 use：观看视频/听音乐/阅读
start_time	与retain_day二选一	long	用户行为起始时间，与end_time共存。
end_time	与retain_day二选一	long	用户行为结束时间，与start_time共存。
retain_day	与start_time二选一	Integer	用户行为时间跨度，整数 [1,10000]。

表4 candidate_set_config参数说明
参数名称	是否必选	参数类型	描述信息
is_recommended_by_category	是	Boolean	按类别推荐（true/false）。

综合行为热度推荐

表5 BehaviorsWeight参数说明
参数名称	是否必选	参数类型	描述信息
data_source_config	是	JSON	请参见表6，数据源参数配置。
algorithm_config	是	JSON	算法参数配置。
candidate_set_config	是	JSON	请参见表8，候选集参数配置。

表6 data_source_config参数说明
参数名称	是否必选	参数类型	描述信息
behavior_weights	是	List	请参见表7，行为权重。
start_time	与retain_day二选一	long	用户行为起始时间。和end_time共存。
end_time	与retain_day二选一	long	用户行为结束时间。和start_time共存。
retain_day	与start_time二选一	Integer	用户行为时间跨度，整数 [1,10000]。

表7 behavior_weights参数说明
参数名称	是否必选	参数类型	说明
behavior_type	是	String	行为类型。 view：物品曝光 click：用户点击物品 collect：用户收藏了某个物品 uncollect：用户取消收藏某个物品 search_click：用户点击搜索结果中的物品 comment：用户对物品的评论 share: 分享 like：点赞 dislike：点衰 grade：评分 consume：消费 use：观看视频/听音乐/阅读
weight	是	Double	权重（(0, 1] 数字，小数保留1位）。

表8 candidate_set_config参数说明
参数名称	是否必选	参数类型	说明
is_recommended_by_category	是	Boolean	按类别推荐（true/false）。

基于物品的协同过滤推荐

表9 ItemCF参数说明
参数名称	是否必选	参数类型	描述信息
data_source_config	是	JSON	请参见表10，数据源参数配置。
algorithm_config	是	JSON	请参见表11，算法参数配置。
candidate_set_config	是	JSON	请参见表12，候选集参数配置。

**表10** data_source_config参数说明
参数名称	是否必选	参数类型	说明
retain_days	是	Integer	用户行为时间跨度，整数 [1,10000]。
behavior_weights	是	List	请参见表7（不包含uncollect和dislike），行为权重。

**表11** algorithm_config参数说明
参数名称	是否必选	参数类型	说明
similar_metric	是	String	相似性度量方式（'cosine'）。

**表12** candidate_set_config参数说明
参数名称	是否必选	参数类型	说明
max_recommended_num	是	Integer	最大推荐结果数，正整数[ 1,10000]。

基于用户的协同过滤推荐

**表13** UserCF参数说明
参数名称	是否必选	参数类型	说明
data_source_config	是	JSON	请参见表14，数据源参数配置。
algorithm_config	是	JSON	请参见表15，算法参数配置。
candidate_set_config	是	JSON	请参见表16，候选集参数配置。

**表14** data_source_config参数说明
参数名称	是否必选	参数类型	说明
retain_days	是	Integer	用户行为时间跨度，整数 [1,10000]。
behavior_weights	是	List	请参见表7（不包含uncollect和dislike），行为权重。

**表15** algorithm_config参数说明
参数名称	是否必选	参数类型	说明
similar_metric	是	String	相似性度量方式（“cosine”）。
user_nn	是	Integer	用户最近邻域数，正整数 [1,100000000]。

**表16** candidate_set_config参数说明
参数名称	是否必选	参数类型	说明
max_recommended_num	是	Integer	最大推荐结果数，正整数 [1,10000]。

基于交替最小二乘的矩阵分解推荐

**表17** AlsCF参数说明
参数名称	是否必选	参数类型	说明
data_source_config	是	JSON	请参见表18，数据源参数配置。
algorithm_config	是	JSON	请参见表19，算法参数配置。
candidate_set_config	是	JSON	候选集参数配置。

**表18** data_source_config参数说明
参数名称	是否必选	参数类型	说明
retain_days	是	Integer	用户行为时间跨度，整数[ 1,10000]。
behavior_weights	是	List	请参见表7，行为权重。

**表19** algorithm_config参数说明
参数名称	是否必选	参数类型	说明
implicit_vector_rank	是	Integer	隐向量维度，整数[ 1,1000]。
max_iterator_num	是	Integer	最大迭代次数，整数 [1,2000)。
regular_param	是	Double	正则化系数，大于0 小于等于1，小数最多保留8位）。

基于历史行为记忆生成候选集

**表20** HistoryBehaviorMemory参数说明
参数名称	是否必选	参数类型	说明
data_source_config	是	JSON	请参见表21，数据源参数配置。
algorithm_config	是	JSON	请参见表22，算法参数配置。
candidate_set_config	是	JSON	候选集参数配置。

**表21** data_source_config参数说明
参数名称	是否必选	参数类型	说明
retain_days	是	Integer	用户行为时间跨度，整数 [1,10000]。

**表22** algorithm_config参数说明
参数名称	是否必选	参数类型	说明
history_behavior_memories	是	List	请参见表23，历史行为记忆。

**表23** his_behavior_memos参数说明
参数名称	是否必选	参数类型	说明
behavior_type	是	String	行为类型。 view：物品曝光 click：用户点击物品 collect：用户收藏了某个物品 uncollect：用户取消收藏某个物品 search_click：用户点击搜索结果中的物品 comment：用户对物品的评论 share: 分享 like：点赞 dislike：点衰 grade：评分 consume：消费 use：观看视频/听音乐/阅读
least_intension	是	Integer	最低强度，整数[1,100]。

人工录入生成候选集

**表24** ManualInput参数说明
参数名称	是否必选	参数类型	说明
data_source_config	是	JSON	数据源参数配置。
algorithm_config	是	JSON	请参见表25，算法参数配置。
candidate_set_config	是	JSON	候选集参数配置。

**表25** algorithm_config参数说明
参数名称	是否必选	参数类型	说明
obs_address	是	String	人工录入候选集地址obs地址，格式为xx//xxx ， //后边不能包含.[^?*<>\|\":]等特殊字符，最大长度256字符。

基于属性匹配的召回策略

**表26** BehaviorsWeight参数说明
参数名称	是否必选	参数类型	说明
portrait_storage	是	JSON	请参见表27，用户画像，物品画像的存储信息。
global_features_information_path	是	String	全局特征信息文件。
match_feature_pairs	是	List	请参见表30，待匹配特征对。
recommended_number	是	Integer	输出的推荐个数【1~1000】。
row	是	Integer	行数。
band	是	Integer	条数。

**表27** portrait_storage参数说明
参数名称	是否必选	参数类型	说明
item_profile_storage	是	JSON	请参见表28，用户画像存储信息。
user_profile_storage	是	JSON	请参见表28，用户画像存储信息。

**表28** item_profile_storage、user_profile_storage参数说明
参数名称	是否必选	参数类型	说明
platform	是	String	平台名称，现支持CloudTable。
platform_parameter	是	JSON	请参见表29，数据存储参数。

**表29** platform_parameter 参数说明
参数名称	是否必选	参数类型	说明
cluster_id	是	String	集群ID。
table_name	是	String	表名称，最大长度64字符。
cluster_name	否	String	集群名称。

**表30** match_feature_pairs参数说明
参数名称	是否必选	参数类型	说明
user_feature_name	是	String	用户特征。
item_feature_name	是	String	物品特征。
alias	是	String	别名。
weight	是	String	权重值，默认为1。

逻辑斯蒂回归

**表31** algorithm_parameters参数说明
参数名称	是否必选	参数类型	说明
fields_feature_size_path	是	String	该文件标识了每一个域下的特征数量，排序数据处理接口会生成这个文件，文件路径为用户在排序数据预处理中输入的结果保存路径参数表示的路径的“fields_feature_size”目录下，文件名称为“part-00000”，需要用户提供文件完整路径。
max_iterations	是	Int	模型训练的最大迭代轮数。取值范围[1,1000]。
early_stop_iterations	是	Int	在测试集上连续early_stop_iterations轮迭代的AUC小于当前最优AUC时，迭代停止，训练结束。取值范围[1,1000]，不大于max_iterations。
initial_parameters	是	JSON	请参见表32，初始化相关参数。示例： { “initial_method”:“normal”,“mean_value”: 0， “standard_deviation”:0.001 }
optimize_parameters	是	JSON	请参见表33，优化策略相关参数。示例： { “type”:“adam”, “epsilon”：1e-08， “learning_rate”：0.001 }
regular_parameters	是	JSON	请参见表34，正则相关参数。示例： { "l2_regularization":0.001, "regular_loss_compute_mode":"full" }
algorithm_specify_parameters	是	JSON	-

**表32** initial_parameters 参数说明
参数名称		是否必选	参数类型	说明
正态分布(normal)	平均值(mean_value)	是	Double	正态分布的平均值。取值范围[-1,1]，默认值为0。
正态分布(normal)	标准差(standard_deviation)	是	Double	正态分布的标准差。取值范围[0, 1]，默认值为0.001。
均匀分布(uniform)	最小值(min_value)	是	Double	均匀分布的最小值，必须小于最大值。取值范围[-1, 0)，默认值为-0.001。
均匀分布(uniform)	最大值(max_value)	是	Double	均匀分布的最大值，必须大于最小值。取值范围(0,1]，默认值为0.001。
xavier	无	是	无	神经元的初始值权重初始化为均值为0，方差为 Var(wi)=1/nin 的均匀分布（高斯或者随机分布）。其中 nin 是该神经元的输入数目。

**表33** optimize_parameters 参数说明
参数名称		是否必选	参数类型	说明
梯度下降(grad)	学习率(learning_rate)	是	Double	决定优化器在优化方向上前进步长的参数。取值范围(0,1]，默认值为0.001。
自适应梯度(adagrad)	初始梯度累加和 (initial_accumulator_value)	是	Double	用来动态调整学习步长。取值范围(0,1]，默认值为0.1。
自适应梯度(adagrad)	学习率(learning_rate)	是	Double	决定优化器在优化方向上前进步长的参数。取值范围(0,1]，默认值为0.001。
自适应矩估计(adam)	数值稳定常量(epsilon)	是	Double	为保证数值稳定而设置的一个微小常量。取值范围(0,1]，默认值为1.00E-08。
自适应矩估计(adam)	学习率(learning_rate)	是	Double	决定优化器在优化方向上前进步长的参数。取值范围(0,1]，默认值为0.001。
在线学习(ftrl)	初始梯度累加和 (initial_accumulator_value)	是	Double	用来动态调整学习步长。取值范围(0,1]，默认值为0.1。
	L1正则项系数(lambda1)	是	Double	叠加在模型的1范数之上，用来对模型值进行限制防止过拟合。取值范围[0,1]，默认值为0。
	L2正则项系数(lambda2)	是	Double	叠加在模型的2范数之上，用来对模型值进行限制防止过拟合。取值范围[0,1]，默认值为0。
	学习率(learning_rate)	是	Double	决定优化器在优化方向上前进步长的参数。取值范围(0,1]，默认值为0.1。

**表34** regular_parameters参数说明
参数名称	是否必选	参数类型	说明
L2正则项系数 (l2_regularization)	是	Double	叠加在模型的2范数之上，用来对模型值进行限制防止过拟合。取值范围[0,1]，默认值为0。
正则损失计算方式 (regular_loss_compute_mode)	是	enum	full指针对全量参数计算，batch则仅针对当前批数据中出现的参数计算，batch模式计算速度快于full模式。默认full。

因子分解机

**表35** algorithm_parameters参数说明
参数名称	是否必选	参数类型	说明
fields_feature_size_path	是	String	该文件标识了每一个域下的特征数量，排序数据处理接口会生成这个文件，文件路径为用户在数据处理中输入的“run_path”参数表示的路径的“fields_feature_size”目录下，文件名称为“part-00000”，需要用户提供文件完整路径。
max_iterations	是	Int	模型训练的最大迭代轮数。取值范围[1,1000]。
early_stop_iterations	是	Int	在测试集上连续early_stop_iterations轮迭代的AUC小于当前最优AUC时，迭代停止，训练结束。取值范围[1,1000]，不大于max_iterations。
algorithm_specify_parameters	是	JSON	请参见表36，算法相关参数。示例： { “latent_vector_length”:10 }
initial_parameters	是	JSON	请参见表32，初始化相关参数。示例： { “initial_method”:“normal”, “mean_value”: 0.0， “standard_deviation”:0.001 }
optimize_parameters	是	JSON	请参见表33，优化策略相关参数。示例： { “type”:“adam”, “epsilon”：1e-08， “learning_rate”：0.001 }
regular_parameters	是	JSON	请参见表34，正则相关参数。示例： { "l2_regularization":0.001, "regular_loss_compute_mode":"full" }

**表36** algorithm_specify_parameters 取值说明
参数名称	是否必选	参数类型	说明
隐向量长度（latent_vector_length)	是	Int	分解后的特征向量的长度。取值范围[1,1000]，默认值10。

域感知因子分解机

algorithm_parameters参数说明请参见因子分解机。

深度网络因子分解机

**表37** algorithm_parameters参数说明
参数名称	是否必选	参数类型	说明
fields_feature_size_path	是	String	该文件标识了每一个域下的特征数量，排序数据处理接口会生成这个文件，文件路径为用户在数据处理中输入的“run_path”参数表示的路径的“fields_feature_size”目录下，文件名称为“part-00000”，需要用户提供文件完整路径。
max_iterations	是	Int	模型训练的最大迭代轮数。取值范围[1,1000]
early_stop_iterations	是	Int	在测试集上连续early_stop_iterations轮迭代的AUC小于当前最优AUC时，迭代停止，训练结束。取值范围[1,1000]，不大于max_iterations。
algorithm_specify_parameters	是	JSON	请参见表38，算法相关参数。示例： { “latent_vector_length”：10， “architecture”：[400,400,400]， “value_keep_probability”: 0.8, “active_function”:“reul” }
initial_parameters	是	JSON	请参见表32，初始化相关参数。示例： { “initial_method”:“normal”, “mean_value”: 0.0， “standard_deviation”：0.001 }
optimize_parameters	是	JSON	请参见表33，优化策略相关参数。示例： { “type”:“adam”, “epsilon”：1e-08， “learning_rate”：0.001 }
regular_parameters	是	JSON	请参见表34，正则相关参数。示例： { "l2_regularization":0.001, "regular_loss_compute_mode":"full" }

**表38** algorithm_specify_parameters 取值说明
参数名称	是否必选	参数类型	说明
隐向量长度（latent_vector_length)	是	Int	分解后的特征向量的长度。取值范围[1,100]，默认10。
神经网络结构 (architecture)	是	List[Int]	神经网络的层数与每一层神经元节点个数。每一层神经元节点数不大于5000，神经网络层数不大于10。默认为400,400,400。
神经元值保留概率 (value_keep_probability)	是	Double	神经网络前向传播过程中以该概率保留神经元的值。取值范围(0,1]，默认0.8。
激活函数 (active_function)	是	Enum	将一个（或一组）神经元的值映射为一个输出值。取值为relu/sigmoid/tanh，默认relu。

核函数特征交互神经网络

**表39** algorithm_parameters参数说明
参数名称	是否必选	参数类型	说明
fields_feature_size_path	是	String	该文件标识了每一个域下的特征数量，排序数据处理接口会生成这个文件，文件路径为用户在数据处理中输入的“run_path”参数表示的路径的“fields_feature_size”目录下，文件名称为“part-00000”，需要用户提供文件完整路径。
max_iterations	是	Int	模型训练的最大迭代轮数。取值范围[1,1000]，默认50。
early_stop_iterations	是	Int	在测试集上连续early_stop_iterations轮迭代的AUC小于当前最优AUC时，迭代停止，训练结束。取值范围[1,1000]，不大于max_iterations，默认5。
algorithm_specify_parameters	是	JSON	请参见表40，算法相关参数。示例： { "latent_vector_length":10, "active_function":"relu", "architecture":[400,400,400], "value_keep_probability":0.8, "sub_net_architecture":[40,5], "is_drop_fm":"False" }
initial_parameters	是	JSON	请参见表32，初始化相关参数。示例： { “initial_method”:“xavier” }
optimize_parameters	是	JSON	请参见表33，优化策略相关参数。示例： { “type”:“adam”, “epsilon”：1e-08， “learning_rate”：0.001 }
regular_parameters	是	JSON	请参见表34，正则相关参数。示例： { "l2_regularization":0.001, "regular_loss_compute_mode":"full" }

**表40** algorithm_specify_parameters 取值说明
参数名称	是否必选	参数类型	说明
隐向量长度（latent_vector_length)	是	Int	分解后的特征向量的长度。取值范围[1,100]，默认10。
神经网络结构 (architecture)	是	List[Int]	神经网络的层数与每一层神经元节点个数。每一层神经元节点数取值范围为[1,1000]，神经网络层数不大于5。默认400,400,400。
神经元值保留概率 (value_keep_probability)	是	Double	神经网络前向传播过程中以该概率保留神经元的值。取值范围(0,1]，默认0.8。
激活函数 (active_function)	是	Enum	将一个（或一组）神经元的值映射为一个输出值。取值relu/sigmoid/tanh，默认relu。
子网络结构 (sub_net_architecture)	是	List[Int]	特征向量之间使用神经网络核来计算相互关系时，该神经网络的结构。每一层的节点数取值范围为[1,100]，深度不超过5层。默认40,5。
是否移除因子分解机 (is_drop_fm)	是	Boolean	是否移除模型架构中的因子分解机部分，值为True则蜕变为带有核函数的DNN。取值true/false，默认false。

父主题： 作业相关API

上一篇：查询全局特征配置

下一篇：停止算子作业

意见反馈

文档内容是否对您有帮助？

有帮助没帮助

提供反馈

提交成功！非常感谢您的反馈，我们会继续努力做到更好！您可在我的云声建议查看反馈及问题处理状态。

系统繁忙，请稍后重试

在使用文档中是否遇到以下问题

内容与产品页面不一致

内容不易理解

缺失示例代码

步骤不可操作

搜不到想要的内容

缺少最佳实践

意见反馈（选填）

0/500

请至少选择一项反馈信息并填写问题反馈

字符长度不能超过500

直接提交取消

如您有其它疑问，您也可以通过华为云社区问答频道来与我们联系探讨

智能客服提问云社区提问