更新时间:2021-09-18 GMT+08:00
分享

特征选择

删除列

删除特征列的场景有很多,例如:两个特征呈线性变化关系,为减少模型训练的开销,删除其中一个特征列。

操作步骤如下所示。

  1. 单击界面右上角的图标,选择“数据处理 > 特征选择 > 删除列”,界面新增“删除列”内容。

    对应参数说明,如表1所示。

    表1 参数说明

    参数

    参数说明

    列筛选方式

    特征列的筛选方式,有如下两种:

    • 列选择
    • 正则匹配

    列名

    列筛选方式为“列选择”时展示,如果有多列特征数据需要删除,可单击“”同时选中多列特征名称。

    正则表达式

    列筛选方式为“正则匹配”时展示,请根据实际情况输入正则表达式,系统自动筛选符合正则筛选规则的所有特征列。

    当前操作流

    从下拉框中选择当前数据操作流的名字。

    操作流变量名

    如果存在多个数据操作流,可重命名操作流对象的变量名,以避免冲突。

  2. 单击图标,运行“删除列”代码框内容。

选择列

如果数据的特征量大,而大多数特征对模型训练无效,可通过“选择列”保留仅对模型训练有意义的特征。

操作步骤如下所示。

  1. 单击界面右上角的图标,选择“数据处理 > 特征选择 > 选择列”,界面新增“选择列”内容。

    对应参数说明,如表2所示。

    表2 参数说明

    参数

    参数说明

    列筛选方式

    特征列的筛选方式,有如下两种:

    • 列·选择
    • 正则匹配

    列名

    列筛选方式为“列选择”时展示,如果有多列特征数据需要保留,可单击“”同时选中多列特征名称。

    正则表达式

    列筛选方式为“正则匹配”时展示,请根据实际情况输入正则表达式,系统自动筛选符合正则筛选规则的所有特征列。

    当前操作流

    从下拉框中选择当前数据操作流的名字。

    操作流变量名

    如果存在多个数据操作流,可重命名操作流对象的变量名,以避免冲突。

  2. 单击图标,运行“选择列”代码框内容。
分享:

    相关文档

    相关产品