机器学习中做特征选择_特征选择-华为云

特征选择

单击界面右上角的图标，选择“数据处理 > 特征选择 > 选择列”，界面新增“选择列”内容。对应参数说明，如表2所示。表2 参数说明参数参数说明列筛选方式特征列的筛选方式，有如下两种：列·选择正则匹配列名列筛选方式为“列选择”时展示，如果有多列特征数据需要保留，可单击“”同时选中多列特征名称。

来自：帮助中心

查看更多 →
机器无法选择？

机器无法选择？请确认机器状态是否正确，资源状态为运行中且UniAgent状态为运行中。 UniAgent安装可参考安装UniAgent。父主题：补丁管理常见问题

来自：帮助中心

查看更多 →
查询特征选择执行结果

"result_ext" : "" } 状态码状态码描述 200 查询执行结果成功 401 操作无权限 500 内部服务器错误父主题：可信联邦学习作业管理

来自：帮助中心

查看更多 →
最新动态

为后续特征选择、模型训练的数据集。公测创建纵向联邦学习作业 2021年3月序号功能名称功能描述阶段相关文档 1 纵向联邦学习纵向联邦机器学习，适用于参与者训练样本ID重叠较多，而数据特征重叠较少的情况，联合多个参与者的共同样本的不同数据特征进行联邦机器学习，联合建模。

来自：帮助中心

查看更多 →
概述

同特征的多行样本进行可信联邦学习，联合建模。模型评估评估训练得出的模型权重在某一数据集上的预测输出效果。纵向联邦机器学习纵向联邦机器学习，适用于参与者训练样本ID重叠较多，而数据特征重叠较少的情况，联合多个参与者的共同样本的不同数据特征进行可信联邦学习，联合建模。概念术语

来自：帮助中心

查看更多 →
Standard自动学习

采用自动机器学习技术，基于信息熵上限近似模型的树搜索最优特征变换和基于信息熵上限近似模型的贝叶斯优化自动调参，从企业关系型（结构化）数据中，自动学习数据特征和规律，智能寻优特征&ML模型及参数，准确性甚至达到专家开发者的调优水平图1 自动学习流程父主题： Standard功能介绍

来自：帮助中心

查看更多 →
基本概念

在旧版体验式开发模式下，模型训练服务支持的特征操作有重命名、归一化、数值化、标准化、特征离散化、One-hot编码、数据变换、删除列、选择特征、卡方检验、信息熵、新增特征、PCA。对应JupyterLab交互式开发模式，是界面右上角的图标中的“数据处理”菜单下面的数据处理算子。模型包

来自：帮助中心

查看更多 →
模型选择

单击“模型选择”代码框左侧的图标，运行代码。运行结果如下所示：特征推荐：学件推荐的特征，除了一些通用的特征（最值、均值等），还有一部分是专门为类似KPI做的异常检测效果比较好的特征。通常采用滑窗的方式做异常检测。目前所有窗口的长度，是根据数据的周期性、样本数、周期的个数等数据特点推荐的。窗口的

来自：帮助中心

查看更多 →
可信智能计算服务 TICS

如何创建多方安全计算作业？可信联邦学习作业可信联邦学习作业是可信智能计算服务提供的在保障用户数据安全的前提下，利用多方数据实现的联合建模，曾经也被称为联邦机器学习。横向联邦机器学习横向联邦机器学习，适用于参与者的数据特征重叠较多，而样本ID重叠较少的情况，联合多个参与者的具有相同特征的多行样本进行联邦机器学习，联合建模。

来自：帮助中心

查看更多 →
创建数据预处理作业

创建数据预处理作业数据预处理是训练机器学习模型的一个重要前置步骤，其主要是通过转换函数将特征数据转换成更加适合算法模型的特征数据过程。 TICS 特征预处理功能能够实现对数据的探索、分析、规整以及转换，以达到数据在训练模型中可使用、可实用，在TI CS 平台内完成数据处理到建模的闭环。

来自：帮助中心

查看更多 →
筛选特征

根据计算得出的iv值，企业A调整了训练使用的特征，没有选用双方提供的特征全集，去掉了部分iv值较低的特征，减少了无用的计算消耗。父主题：使用TICS可信联邦学习进行联邦建模

来自：帮助中心

查看更多 →
特征操作

在执行PCA之前，系统会对所有数值型的特征字段先做标准化处理。对于字段类型为text的字段，系统会先做数值化处理，然后做标准化处理。 PCA操作步骤如下。单击“特征操作”，从下拉框中选择“PCA”。弹出“PCA”对话框。参数配置如下所示：转换数目：转换后的特征列数。例如，待降维的特征列有5列，配置

来自：帮助中心

查看更多 →
特征画像

。这些类别，对应到后面的特征选择、算法推荐，会有不同的策略，有效提升模型的构建效率。单击“选择数据”左下方的“特征画像”。新增“特征画像”内容，如图1所示。图1 特征画像单击“特征画像”代码框左侧的图标，运行代码。通过运行结果左侧两个图可以直观的看一下原始数据和数据的密

来自：帮助中心

查看更多 →
呼叫特征

呼叫特征表1 呼叫特征说明值说明 0 普通客户呼叫 1 来自话务员 2 长途客户呼叫 3 CTI收到网络路由实呼后发起的路由 4 国际长途来话 40 预约呼出 41 预占用呼出 42 预连接呼出 43 虚呼入呼出 44 预览呼出 45 回呼请求 51 内部求助父主题：附录

来自：帮助中心

查看更多 →
提交排序任务API

分解机每个特征对其他域的隐向量都一致，而域感知因子分解机每个特征对其他每个域都会学习一个隐向量，能够达到更高的精度，但也更容易出现过拟合。FFM算法参数请参见域感知因子分解机。深度网络因子分解机，结合了因子分解机和深度神经网络对于特征表达的学习，同时学习高阶和低阶特征组合，从而

来自：帮助中心

查看更多 →
各个模型深度学习训练加速框架的选择

各个模型深度学习训练加速框架的选择 LlamaFactory框架使用两种训练框架： DeepSpeed和Accelerate都是针对深度学习训练加速的工具，但是它们的实现方式和应用场景有所不同。 DeepSpeed是一种深度学习加速框架，主要针对大规模模型和大规模数据集的训练。D

来自：帮助中心

查看更多 →
创建纵向联邦学习作业

用户登录进入计算节点页面。在左侧导航树上依次选择“作业管理 > 可信联邦学习”，打开可信联邦学习作业页面。在“可信联邦学习”页面，单击“创建”。图1 创建作业在弹出的对话框中单击“纵向联邦”按钮，编辑“作业名称”等相关参数，完成后单击“确定”。目前，纵向联邦学习支持“XGBoost”、“逻

来自：帮助中心

查看更多 →
GS_OPT_MODEL

续扩展。 model_name name 模型的实例名，每个模型对应AiEngine在线学习进程中的一套参数、训练日志、模型系数。此列需为unique。 datname name 该模型所服务的database名，每个模型只针对单个database。此参数决定训练时所使用的数据。

来自：帮助中心

查看更多 →
GS_OPT_MODEL

续扩展。 model_name name 模型的实例名，每个模型对应AiEngine在线学习进程中的一套参数、训练日志、模型系数。此列需为unique。 datname name 该模型所服务的database名，每个模型只针对单个database。此参数决定训练时所使用的数据。

来自：帮助中心

查看更多 →
GS_OPT_MODEL

续扩展。 model_name name 模型的实例名，每个模型对应AiEngine在线学习进程中的一套参数、训练日志、模型系数。此列需为unique。 datname name 该模型所服务的database名，每个模型只针对单个database。此参数决定训练时所使用的数据。

来自：帮助中心

查看更多 →
数据管理概述

功能。连接信息中的敏感部分不会离开参与方侧。数据管理包含创建数据和数据预处理，是可信智能计算服务的一项获取、配置及发布数据资源的功能。参与方进入数据管理>数据创建页面，选择对应连接器（连接器管理中已建立完备），将需要共享的数据发布至空间侧，并支持通过转换函数将特征数据转换成更加适合算法模型的特征数据。

来自：帮助中心

查看更多 →