召回策略
召回是指对大量的物品做初选,为每一个用户形成个性化侯选集。召回策略是指通过大数据计算或深度训练生成推荐候选集的算法策略。召回策略中内置了多种召回方式,您可根据自己场景选择。
基于综合行为热度推荐
参数名称 |
说明 |
---|---|
名称 |
策略名称,由中文、英文、数字、下划线、空格或者中划线组成,并且不能以空格开始和结束,长度为1~64个字符。 |
描述 |
策略的具体描述。 |
行为次数统计方法 |
物品记录统计方式。
|
用户分群 |
数据源类型包括用户特征和物品特征,根据数据源筛选数据, 选出需要的属性。只能选择进行用户分组还是物品分组,分组内可配置多个特征。
|
最大推荐结果数 |
每个用户最多生成多少个推荐结果。 |
开启时间跨度 |
不开启取全部数据,开启则指定从数据源中取最近天数或小时数的行为数据计算相似度。 |
时间单位 |
开启时间跨度后,支持按照天或者小时为单位从指定从数据源中取行为数据计算相似度。 |
时间跨度 |
用于指定从数据源中取最近多少天或者多少小时的行为数据计算热度。默认取全部数据。 |
开启调度 |
开启调度,按照指定的调度策略定期执行作业。
|
基于物品的协同过滤推荐
参数名称 |
说明 |
---|---|
名称 |
策略名称,由中文、英文、数字、下划线、空格或者中划线组成,并且不能以空格开始和结束,长度为1~64个字符。 |
描述 |
策略的具体描述。 |
最近邻域数 |
在ItemCF算法中使用,生成的相似度矩阵中为每个物品保留的若干个最相似物品。默认100。 |
用户活跃度 |
用来过滤用户的活跃度阈值。 取值范围:1-10000。 默认值:1。 |
效用阈值 |
用户对物品综合打分的阈值。 取值范围:0.000001-10。 |
最小交叉度 |
物品和物品之间被同一用户行为记录的数量,计算相似度时,过滤掉共同记录小于最小交叉度的item。 默认值:1。 |
最大推荐结果数 |
最多生成多少个推荐结果。 默认值:100。 |
开启时间跨度 |
不开启取全部数据,开启则指定从数据源中取最近天数的行为数据计算相似度。 |
时间跨度(天) |
用于指定从数据源中取最近多少天的行为数据计算相似度。默认取全部数据。 |
上传物品相似度 |
支持客户通过obs导入自定义的相似度信息。相似度文件格式为json, 其中subject为用户或物品, relations为与subject相似的用户或物品及其相似度。例如, { "subject": "item108", "relations": [ { "id": "item115", "score": 0.699357793663589 }, { "id": "item60", "score": 0.659905609639582 }, { "id": "item61", "score": 0.640305447750641 }, { "id": "item18", "score": 0.614275316537666 } ] } |
开启调度 |
开启调度,按照指定的调度策略定期执行作业。
|
基于用户的协同过滤推荐
基于用户的协同过滤推荐采用经典算法基于用户的协同过滤(UserCF)进行召回。基于用户的协同过滤算法是通过用户的历史行为数据发现用户对物品的喜欢(如购买,收藏,内容评论或分享),并对这些喜好进行度量和打分。根据不同用户对相同物品的态度和偏好程度计算用户之间的关系。在有相同喜好的用户间进行物品推荐。
参数名称 |
说明 |
---|---|
名称 |
策略名称,由中文、英文、数字、下划线、空格或者中划线组成,并且不能以空格开始和结束,长度为1~64个字符。 |
描述 |
策略的具体描述。 |
最近邻域数 |
在UserCF算法中使用,生成的相似度矩阵中为每个用户保留的若干个最相似用户。默认为100。 |
最小交叉度 |
物品和物品之间被同一用户行为记录的数量,计算相似度时,过滤掉共同记录小于最小交叉度的item。 默认值:1。 |
物品活跃度 |
物品过滤用户的活跃度阈值。 取值范围:1-10000。 默认值:1。 |
效用阈值 |
用户对物品综合打分的阈值。 取值范围:0.000001-10。 |
最大推荐结果数 |
最多生成多少个推荐结果。 默认值:100。 |
开启时间跨度 |
不开启取全部数据,开启则指定从数据源中取最近天数的行为数据计算相似度。 |
时间跨度 |
用于指定从数据源中取最近多少天的行为数据计算相似度。默认取全部数据。 |
上传物品相似度 |
支持客户通过obs导入自定义的相似度信息。相似度文件格式为json, 其中subject为用户或物品, relations为与subject相似的用户或物品及其相似度。例如, { "subject": "item108", "relations": [ { "id": "item115", "score": 0.699357793663589 }, { "id": "item60", "score": 0.659905609639582 }, { "id": "item61", "score": 0.640305447750641 }, { "id": "item18", "score": 0.614275316537666 } ] } |
开启调度 |
开启调度,按照指定的调度策略定期执行作业。
|
基于交替最小二乘的矩阵分解推荐
参数名称 |
说明 |
---|---|
名称 |
策略名称,由中文、英文、数字、下划线、空格或者中划线组成,并且不能以空格开始和结束,长度为1~64个字符。 |
描述 |
策略的具体描述。 |
隐向量维度 |
在ALS算法中使用,指定用户隐向量、物品隐向量的隐含因子的维度大小。如果离线计算失败,建议调小至10以下。默认为10。 |
迭代次数 |
指定迭代优化的最大迭代次数。如果离线计算失败,建议调小至10以下。默认为10。 |
优化正则化系数 |
在ALS算法中使用,指定正则化系数,作为优化目标中参数项代价的系数,用于避免过拟合现象发生。默认为0.01。 |
最大推荐结果数 |
最多生成多少个推荐结果。默认为100。 |
开启调度 |
开启调度,按照指定的调度策略定期执行作业。
|
业务规则-基于历史行为记忆生成候选集
参数名称 |
说明 |
---|---|
名称 |
策略名称,由中文、英文、数字、下划线、空格或者中划线组成,并且不能以空格开始和结束,长度为1~64个字符。 |
描述 |
策略的具体描述。 |
频次 |
单击,增加频次。你可以单击右侧的删除该频次。 |
最大推荐结果数 |
最多生成多少个推荐结果。默认为100。 |
开启调度 |
开启调度,按照指定的调度策略定期执行作业。
|
业务规则-人工导入
参数名称 |
说明 |
---|---|
名称 |
策略名称,由中文、英文、数字、下划线、空格或者中划线组成,并且不能以空格开始和结束,长度为1~64个字符。 |
描述 |
策略的具体描述。 |
OBS地址 |
用户可从此OBS地址中选择自定义物品列表的csv文件。单击,从弹出的对话框中,选择数据存储的OBS桶及其文件夹。 |
导入候选集类型 |
选择导入候选集类型,目前支持以下三种。
|
最大推荐结果数 |
最多生成多少个推荐结果。默认为100。 |
开启调度 |
开启调度,按照指定的调度策略定期执行作业。
|
数据格式(.csv文件):
itemId1
itemId2
itemId为物品id,算法将物品列表上传的物品作为候选集
用户可从OBS中选择保存有人工编辑推荐结果的列表(即物品ID)。
基于特征匹配的召回策略
基于特征匹配的召回策略会用用户画像和物品画像的相关属性进行匹配,为用户召回属性匹配程度高的若干个物品。
参数名称 |
说明 |
---|---|
名称 |
策略名称,由中文、英文、数字、下划线、空格或者中划线组成,并且不能以空格开始和结束,长度为1~64个字符。 |
描述 |
策略的具体描述。 |
匹配类型 |
通过匹配数据的特征,生成推荐候选集。 例如,通过用户匹配物品生成给用户推荐物品的候选集,物品自匹配生成给物品推荐物品的候选集。可选:
|
匹配特征对 |
用户和物品相关联特征。请根据实际情况配置参数,如果属性匹配特征对相似度较高内存不够时需提升配置。
您可以单击进入“添加匹配特征对”页面进行配置。设置特征对的用户特征名、物品特征名和权重。 |
最近邻域数 |
机器学习中的概念, 例如协同过滤计算中,需要计算物品之间,用户之间的相似度。最近邻域数是x,就是一个物品/用户找出x个和他相似的物品/用户。默认为100。 |
最大推荐结果数 |
最多生成多少个推荐结果。默认为100。 |
开启调度 |
开启调度,按照指定的调度策略定期执行作业。
|
基于UCB的召回策略
参数名称 |
说明 |
---|---|
名称 |
策略名称,由中文、英文、数字、下划线、空格或者中划线组成,并且不能以空格开始和结束,长度为1~64个字符。 |
描述 |
策略的具体描述。 |
最小行为次数 |
在物品上产生过行为的最小用户数,其中一个用户在一个物品上只计算一次行为。默认为30。 |
折中参数 |
令alpha为Exploration 和 Exploitation之间的折中参数,其取值范围为[0,1],alpha越趋近于0,则物品的得分对历史得分高的物品越有利,即 Exploitation。反之,alpha越趋近于1,则物品的得分越倾向于探索新物品,即Exploration。默认为0.5。 |
最大推荐结果数 |
最多生成多少个推荐结果。默认为100。 该参数会运用在“输出数据”的推荐候选集上。 |
时间跨度(天) |
用于指定从数据源中取最近多少天的行为数据计算热度。默认取全部数据。 |
开启调度 |
开启调度,按照指定的调度策略定期执行作业。
|
近线召回
参数名称 |
说明 |
---|---|
名称 |
近线召回名称,由中文、英文、数字、下划线、空格或者中划线组成,并且不能以空格开始和结束,长度为1~64个字符。 |
描述 |
对于近线召回策略的描述信息。 |
itemCF作业名称 |
默认无。 填写后可利用itemCF作业生成的结果,进一步扩大召回候选集的范围。 |
开启时间过滤 |
开启时间过滤即对候选集进行时间上的过滤。默认关闭。
开启之后需配置如下参数:
召回结果中,仅保留符合 ((当前时间-过滤字段的值)< 保留期)的召回结果。 |
召回字段 |
召回字段即在召回时,仅利用选择的召回字段进行召回。 数据结构任务完成后,人工复核中,选中应用于兴趣属性的物品特征(如果物品特征为tags,选中应用于兴趣属性。则在召回字段下拉栏中显示为“interested_tags”)。选中召回字段后,默认利用该字段中召回的字段值个数为1(可根据实际需求进行调整)。
|
最大推荐结果数 |
最多生成多少个推荐结果。默认100。 该参数会运用在“输出数据”的推荐候选集上。 |
开启异常告警 |
开启异常告警即当任务发生异常时,产生告警通知到客户。默认关闭。开启之后需配置如下参数: “主题名称”:单击选择SMN主题。如果您还未有可选的主题,请前往消息通知服务创建主题。 |
基于物品相似度的实时召回
基于物品相似度的实时召回策略是根据用户短时间内行为数据(如购买,收藏,内容评论或分享),通过牛顿冷却定律对相关行为的初始权重进行衰减和汇总,从而找出用户该时间段内感兴趣的物品,结合物品的相似度信息进行关联推荐。
参数名称 |
说明 |
---|---|
名称 |
策略名称,由中文、英文、数字、下划线、空格或者中划线组成,并且不能以空格开始和结束,长度为1~64个字符。 |
描述 |
策略的具体描述。 |
依赖作业名称 |
已经完成的可以提供物品和物品相似度关系的作业,用来进行物品的关联推荐。 |
topK |
用户最感兴趣的排序在前K个的物品。 |
行为 |
|
基于用户相似度的实时召回
基于用户相似度的实时召回策略是根据用户间的相似度信息,找到相似用户短时间内行为数据(如购买,收藏,内容评论或分享),通过牛顿冷却定律对相关行为的初始权重进行衰减和汇总,从而找出相似用户该时间段内感兴趣的物品,加权汇总后推荐给该用户。
参数名称 |
说明 |
---|---|
名称 |
策略名称,由中文、英文、数字、下划线、空格或者中划线组成,并且不能以空格开始和结束,长度为1~64个字符。 |
描述 |
策略的具体描述。 |
依赖作业名称 |
已经完成的可以提供用户和用户相似度关系的作业,用来进行用户的关联推荐。 |
topK |
用户最感兴趣的排序在前K个的物品。 |
行为 |
|