更新时间:2023-05-16 GMT+08:00
分享

线性特征重要性

概述

用线性模型计算训练数据的特征重要性。

输入

参数

子参数

参数说明

inputs

dataframe

inputs为字典类型,dataframe为pyspark中的DataFrame类型对象

输出

特征的重要性和特征在线性模型中的weights,格式是dataFrame。

列名

公式

weight

abs(w_)

importance

abs(w_j) * STD(f_i)

参数说明

参数

参数说明

feature_cols

特征列

label_col

label列

item_spliter

稀疏特征的iterm之间的分割符

kv_spliter

稀疏特征中每个iterm的KV分割符

model_path

线性模型的输入路径

样例

输入数据

配置流程

运行流程

输出结果

分享:

    相关文档

    相关产品