相关性分析
概述
对数据集的数值列进行相关性分析。
输入
参数 |
子参数 |
参数说明 |
---|---|---|
inputs |
dataframe |
inputs为字典类型,dataframe为pyspark中的DataFrame类型对象 |
输出
参数 |
子参数 |
参数说明 |
---|---|---|
output |
output_port_1 |
dataframe类型的相关系数矩阵 |
参数说明
参数 |
是否必选 |
参数说明 |
默认值 |
---|---|---|---|
selected_columns_str |
是 |
选择的列组成的格式化字符串,列必须为数值类型,例如: "column_a" "column_a,column_b" |
"" |
method |
是 |
采用相关性分析的方法,支持"pearson"和"spearman" |
"pearson" |
样例
数据样本
配置流程
运行流程
参数设置
查看结果