卡方独立性检验
卡方独立性检验目前仅支持在MLStudio镜像内运行,不支持发布到dli。
概述
卡方独立性检验是检验两个变量之间是否存在相关性。一般认为这两个变量是分类变量,我们认为两者之间是不相关的,可以通过检验来确定该看法。
输入
参数 |
子参数 |
参数说明 |
---|---|---|
inputs |
dataframe |
inputs为字典类型,dataframe为pyspark中的DataFrame类型对象 |
输出
参数 |
子参数 |
参数说明 |
---|---|---|
output |
output_port_1 |
dataframe类型的计算过程数据 |
output |
statistic_summary |
dataframe类型的统计检验结果 |
参数说明
参数 |
是否必选 |
参数说明 |
默认值 |
---|---|---|---|
selected_column1 |
是 |
卡方独立性检验特征列列名 |
"" |
selected_column2 |
是 |
卡方独立性检验特征列列名 |
"" |
样例
数据样本
配置流程
运行流程
算法参数设置
查看结果