更新时间:2023-05-05 GMT+08:00
分享

相关性分析

概述

对数据集的数值列进行相关性分析。

输入

参数

子参数

参数说明

inputs

dataframe

inputs为字典类型,dataframe为pyspark中的DataFrame类型对象

输出

参数

子参数

参数说明

output

output_port_1

dataframe类型的相关系数矩阵

参数说明

参数

是否必选

参数说明

默认值

selected_columns_str

选择的列组成的格式化字符串,列必须为数值类型,例如:

"column_a"

"column_a,column_b"

""

method

采用相关性分析的方法,支持"pearson"和"spearman"

"pearson"

样例

数据样本

配置流程

运行流程

参数设置

查看结果

分享:

    相关文档

    相关产品