更新时间:2022-09-01 GMT+08:00
分享

替换

概述

“替换”节点用于对数据中指定属性名满足条件的内容进行替换。

用户可以根据需要,从输入数据集中依据条件替换某一个或多个属性,可选的条件包括“=”、“!=”、“Like”、“Between”等。

输入

参数

子参数

参数说明

inputs

dataframe

inputs为字典类型,dataframe为pyspark中的DataFrame类型对象

输出

数据集

参数说明

参数

子参数

参数说明

conditions_str

-

替换条件组成的格式化字符串,例如:

"column_a,>,50,1" 表示将column_a列大于50的值替换为1

"column_b,like,HS%,IS HS;column_c,between,50,100,1;column_d,is null,0.0"

样例

inputs = {
    "dataframe": None  # @input {"label":"dataframe","type":"DataFrame"}
}
params = {
    "inputs": inputs,
    "conditions_str": ""  # @param {"label":"conditions_str","type":"string","required":"true","helpTip":""}
}
field_replace____id___ = MLSFieldReplace(**params)
field_replace____id___.run()
# @output {"label":"dataframe","name":"field_replace____id___.get_outputs()['output_port_1']","type":"DataFrame"}

分享:

    相关文档

    相关产品

close