特征尺度变换
概述
支持对稠密或稀疏的数值类特征进行常见的尺度变换,支持常见的log2、log10、ln、abs及sqrt等尺度变化函数。
输入
参数 |
子参数 |
参数说明 |
---|---|---|
inputs |
dataframe |
inputs为字典类型,dataframe为pyspark中的DataFrame类型对象 |
输出
dataFrame
参数说明
参数 |
参数说明 |
默认值 |
---|---|---|
scale_cols |
需要被进行尺度变换的特征名 |
- |
scale_method |
尺度变换的方法 |
"ln" |
item_spliter |
离散型特征的,iterm之间的分割符 |
"," |
kv_spliter |
离散型特征KV的分割符 |
":" |
样例
输入数据
配置流程
运行流程
参数设置
输出结果