排序策略-离线排序模型
排序策略简介
排序策略用于训练排序模型,该模型将被用于对召回策略召回的候选集进行排序,以将推荐物品顺序调整到最优。
Logistic Regression (LR)
LR算法是一种广义的线性回归分析模型,常用于数据挖掘、疾病自动诊断、经济预测等领域。LR算法通过在线性回归的基础上叠加一个sigmoid激活函数将输出值映射到[0,1]之间,是机器学习领域里常用的二分类算法。
参数名称 |
说明 |
---|---|
名称 |
自定义策略名称,由中文、英文、数字、下划线、空格或者中划线组成,并且不能以空格开始和结束,长度为1~64个字符。 |
描述 |
对于该策略的描述信息。 |
最大迭代轮数 |
模型训练的最大迭代轮数,默认50。 |
提前终止训练轮数 |
在测试集上连续N轮迭代AUC无提高时,迭代停止,训练提前结束,默认5。 |
初始化方法 |
模型参数的初始化方法。 |
优化器类型 |
|
L2正则项系数 |
叠加在模型的2范数之上,用来对模型值进行限制防止过拟合。默认0。 |
正则损失计算方式 |
正则损失计算当前有两种方式。
|
重新训练 |
对第一次训练无影响,仅影响任务重跑。
|
批量大小 |
一次训练所选取的样本数。 |
训练数据集切分数量 |
将整个数据集切分成多个子数据集,依次训练,每个epoch训练一个子数据集。 |
DeepFM
DeepFM,结合了FM和深度神经网络对于特征表达的学习,同时学习高阶和低阶特征组合,从而达到准确地特征组合学习,进行精准推荐。
参数名称 |
说明 |
---|---|
名称 |
自定义策略名称,由中文、英文、数字、下划线、空格或者中划线组成,并且不能以空格开始和结束,长度为1~64个字符。 |
描述 |
对于该策略的描述信息。 |
最大迭代轮数 |
模型训练的最大迭代轮数,默认50。 |
提前终止训练轮数 |
在测试集上连续N轮迭代AUC无提高时,迭代停止,训练提前结束,默认5。 |
初始化方法 |
模型参数的初始化方法。 |
优化器类型 |
|
L2正则项系数 |
叠加在模型的2范数之上,用来对模型值进行限制防止过拟合。默认0。 |
正则损失计算方式 |
正则损失计算当前有两种方式。
|
隐向量长度 |
分解后的表示特征的向量的长度。默认10。 |
神经网络结构 |
神经网络的层数与每一层的神经元节点个数。默认400,400,400。 |
激活函数 |
神经网络中的激活函数,将一个(或一组)神经元的值映射为一个输出值。
|
神经元值保留概率 |
神经网络前向传播过程中以该概率保留神经元的值。默认0.8。 |
重新训练 |
对第一次训练无影响,仅影响任务重跑。
|
批量大小 |
一次训练所选取的样本数。 |
训练数据集切分数量 |
将整个数据集切分成多个子数据集,依次训练,每个epoch训练一个子数据集。 |
AutoGroup
AutoGroup,使用自动分组技术探索高阶特征交互组合,更深层次地挖掘出多个特征间联系,增强模型排序效果。
参数名称 |
说明 |
---|---|
名称 |
自定义策略名称,由中文、英文、数字、下划线、空格或者中划线组成,并且不能以空格开始和结束,长度为1~64个字符。 |
描述 |
对于该策略的描述信息。 |
最大交互阶数 |
算法探索的最大的特征交互阶数。例如,当设定最大交互阶数为4时,算法会探索2阶、3阶、4阶的特征交互组合。默认3。 |
各阶隐向量长度 |
各阶特征交互使用的隐向量长度,数量需对应最大交互阶数。默认10,60,80。 |
哈希长度 |
每阶特征交互所选择的group数量,数量需对应最大交互阶数。默认10,60,80。 |
特征交互层惩罚项系数 |
特征交互层输出值的惩罚项系数,用来防止过拟合。默认0.0001,0.0001,0.0001。 |
神经网络结构 |
神经网络的层数与每一层的神经元节点个数。默认400,400,400。 |
激活函数 |
神经网络中的激活函数,将一个(或一组)神经元的值映射为一个输出值。
|
神经元值保留概率 |
神经网络前向传播过程中以该概率保留神经元的值。默认0.8。 |
优化器类型 |
|
结构部分优化器 |
详细参数请参见优化器类型。 |
正则损失计算方式 |
正则损失计算当前有两种方式。
|
L2正则项系数 |
叠加在模型的2范数之上,用来对模型值进行限制防止过拟合。默认0。 |
隐向量层L2正则化系数 |
隐向量层使用的L2正则化系数,作用如“L2正则项系数”描述。默认0.001。 |
wide部分L2正则化系数 |
wide层使用的L2正则化系数,作用如“L2正则项系数”描述。默认0.001。 |
最大迭代轮数 |
模型训练的最大迭代轮数,默认50。 |
提前终止训练轮数 |
在测试集上连续N轮迭代AUC无提高时,迭代停止,训练提前结束,默认5。 |
重新训练 |
对第一次训练无影响,仅影响任务重跑。
|
批量大小 |
一次训练所选取的样本数。 |
训练数据集切分数量 |
将整个数据集切分成多个子数据集,依次训练,每个epoch训练一个子数据集。 |
融合多值特征 |
将多值特征的多个embedding融合成一个embedding。 |
融合线性部分 |
是否使用模型架构中的线性部分。 |
固定哈希结构 |
是否固定结构参数。默认值为“否”,非特殊情况建议使用默认值。 |