更新时间:2023-05-05 GMT+08:00
分享

全表统计

概述

对数据集指定的某些列做全表统计,包括元素总数、null值个数、nan值个数、最小值、最大值、方差、标准差等。

输入

参数

子参数

参数说明

inputs

dataframe

inputs为字典类型,dataframe为pyspark中的DataFrame类型对象

输出

表1

参数

子参数

参数说明

output

output_port_1

dataframe类型的统计结果

参数说明

参数

是否必选

参数说明

默认值

select_columns_str

列名组成的格式化字符串,例如:

"column_a"

"column_a,column_b"

""则表示全选

""

样例

数据样本

配置流程

运行流程:

算法参数设置:

查看结果:

分享:

    相关文档

    相关产品