更新时间:2023-05-16 GMT+08:00
分享

swing

概述

swing是一个i2i的召回算法,基于User-Item-User图结构的推荐算法。

输入

参数

子参数

参数说明

inputs

dataframe

inputs为字典类型,dataframe为pyspark中的DataFrame类型对象,用于构建swing模型

输出

参数

子参数

参数说明

outputs

output_port_1

指向一个pyspark的DataFrame类型对象,swing的pipeline模型

参数说明

参数

是否必选

参数说明

默认值

user_col

User列的名称

user

item_col

Item列的名称

item

score_col

用户评分列名称

""

min_user_items

User互动的Item的最小数量

10

max_user_items

User互动的Item的最大数量

1000

max_item_number

Item参与计算的人数最大值

1000

output_score_col_name

预测用户评分的列名

rec_score

user_alpha

User的alpha参数。用于计算用户权重:user weight = 1.0/(userAlpha + userClickCount)^userBeta

0.0

user_beta

User的Beta参数。用于计算用户权重:user weight = 1.0/(userAlpha + userClickCount)^userBeta

0.5

样例

数据样本

user,item
A,t
A,r
A,p
B,t
B,r
B,p
C,p
C,q
A,h
B,h
C,h

配置流程

运行流程

参数设置

查看结果

user,item,rec_score
C,t,0.1
C,r,0.1

分享:

    相关文档

    相关产品