更新时间:2023-05-05 GMT+08:00
分享

正则化

概述

使用p范式对向量进行正则化。

输入

参数

子参数

参数说明

inputs

dataframe

inputs为字典类型,dataframe为pyspark中的DataFrame类型对象

输出

spark pipeline类型的模型

参数说明

参数

子参数

参数说明

input_features_str

-

数据集的特征列名组成的格式化字符串,例如:

"column_a"

"column_a,column_b"

output_col

-

输出的结果列名

p

-

用第几范式进行正则化

样例

inputs = {
    "dataframe": None  # @input {"label":"dataframe","type":"DataFrame"}
}
params = {
    "inputs": inputs,
    "b_output_action": True,
    "outer_pipeline_stages": None,
    "input_features_str": "",  # @param {"label":"input_features_str","type":"string","required":"false","helpTip":""}
    "output_col": "norm_output_features",  # @param {"label":"output_col","type":"string","required":"false","helpTip":""}
    "p": 2  # @param {"label":"p","type":"integer","required":"false","helpTip":""}
}
normalizer____id___ = MLSNormalizer(**params)
normalizer____id___.run()
# @output {"label":"pipeline_model","name":"normalizer____id___.get_outputs()['output_port_1']","type":"PipelineModel"}

分享:

    相关文档

    相关产品