机器学习特征归一化_基本概念-华为云

基本概念

可支持用户进行机器学习、深度学习、模型训练作业开发的框架，如Tensorflow、Spark MLlib、MXNet、PyTorch、华为自研AI框架MindSpore等。数据集某业务下具有相同数据格式的数据逻辑集合。特征操作特征操作主要是对数据集进行特征处理。在旧版体

来自：帮助中心

查看更多 →
产品术语

产品术语 A AI应用市场提供AI模型的交易市场，是AI消费者接触NAIE云服务的线上门户，是AI消费者对已上架的AI模型进行查看、试用、订购、下载和反馈意见的场所。 AI引擎可支持用户进行机器学习、深度学习、模型训练的框架，如Tensorflow、Spark MLlib、MXNe

来自：帮助中心

查看更多 →
文件上传归一化

文件上传归一化功能介绍文件上传归一化调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI POST /v2/fileservice/file/upload 请求参数表1

来自：帮助中心

查看更多 →
概述

文件管理文件管理是可信智能计算服务提供的一项管理联邦学习模型文件的功能。参与方无需登录后台手动导入模型文件，通过该功能即可将模型文件上传到数据目录，并支持批量删除。在创建联邦学习作业时可以选到上传的脚本模型等文件，提高了易用性及可维护性。使用场景：管理联邦学习作业所需的脚本、模型、权重文件。

来自：帮助中心

查看更多 →
Standard自动学习

Standard自动学习 ModelArts通过机器学习的方式帮助不具备算法开发能力的业务开发者实现算法的开发，基于迁移学习、自动神经网络架构搜索实现模型自动生成，通过算法实现模型训练的参数自动化选择和模型自动调优的自动学习功能，让零AI基础的业务开发者可快速完成模型的训练和部署。

来自：帮助中心

查看更多 →
特征选择

特征选择删除列删除特征列的场景有很多，例如：两个特征呈线性变化关系，为减少模型训练的开销，删除其中一个特征列。操作步骤如下所示。单击界面右上角的图标，选择“数据处理 > 特征选择 > 删除列”，界面新增“删除列”内容。对应参数说明，如表1所示。表1 参数说明参数参数说明

来自：帮助中心

查看更多 →
数据转换

默认值：0。归一化最大值归一化后数据均小于“归一化最大值”。默认值：1。即特征归一化完成后，数据的区间为(0,1)。数据最小值需要做归一化处理的特征数据最小值或者特征理论上可以取到的最小值。如果用户输入，则直接从界面获取，否则后台自动计算特征数据最小值。默认值为“None”。即用户不输入数据最小值。

来自：帮助中心

查看更多 →
数据准备

乳腺癌数据集从UCI获取，该数据集只包含连续类型特征，因此对所有特征使用Scikit-Learn的StandardScaler进行了归一化。为了模拟横向联邦学习场景，将数据集随机划分为三个大小类似的部分：（1）xx医院的训练集；（2）其他机构的训练集；（3）独立的测试集，用于准确评估横向联邦学习得到的模型准确率

来自：帮助中心

查看更多 →
特征操作

特征操作特征操作主要是对特征的样本数据值进行修改，也可以重命名、删除、筛选特征列。同时模型训练服务集成了基于开源的交互式开发调试工具，支持用户编辑算法自定义修改特征列。模型训练服务支持的特征操作有重命名、归一化、数值化、标准化、特征离散化、One-hot编码、数据变换、删除列、

来自：帮助中心

查看更多 →
可信智能计算服务 TICS

如何创建多方安全计算作业？可信联邦学习作业可信联邦学习作业是可信智能计算服务提供的在保障用户数据安全的前提下，利用多方数据实现的联合建模，曾经也被称为联邦机器学习。横向联邦机器学习横向联邦机器学习，适用于参与者的数据特征重叠较多，而样本ID重叠较少的情况，联合多个参与者的具有相同特征的多行样本进行联邦机器学习，联合建模。

来自：帮助中心

查看更多 →
筛选特征

根据计算得出的iv值，企业A调整了训练使用的特征，没有选用双方提供的特征全集，去掉了部分iv值较低的特征，减少了无用的计算消耗。父主题：使用 TICS 可信联邦学习进行联邦建模

来自：帮助中心

查看更多 →
特征画像

。这些类别，对应到后面的特征选择、算法推荐，会有不同的策略，有效提升模型的构建效率。单击“选择数据”左下方的“特征画像”。新增“特征画像”内容，如图1所示。图1 特征画像单击“特征画像”代码框左侧的图标，运行代码。通过运行结果左侧两个图可以直观的看一下原始数据和数据的密

来自：帮助中心

查看更多 →
呼叫特征

呼叫特征表1 呼叫特征说明值说明 0 普通客户呼叫 1 来自话务员 2 长途客户呼叫 3 CTI收到网络路由实呼后发起的路由 4 国际长途来话 40 预约呼出 41 预占用呼出 42 预连接呼出 43 虚呼入呼出 44 预览呼出 45 回呼请求 51 内部求助父主题：附录

来自：帮助中心

查看更多 →
最新动态

为后续特征选择、模型训练的数据集。公测创建纵向联邦学习作业 2021年3月序号功能名称功能描述阶段相关文档 1 纵向联邦学习纵向联邦机器学习，适用于参与者训练样本ID重叠较多，而数据特征重叠较少的情况，联合多个参与者的共同样本的不同数据特征进行联邦机器学习，联合建模。

来自：帮助中心

查看更多 →
排序策略-离线特征工程

“不离散”：（默认）不做归一化，不对数据做处理。待提取物品特征排序模型需要经特征工程处理后的数据，选择排序模型需要的物品特征，未选择的物品特征将不会被处理，即排序模块将忽略这些特征。说明：离散的区间个数不能超过100个，请您根据业务需求合理分配参数值。单击，增加物品特征。在下拉选项

来自：帮助中心

查看更多 →
特征工程

行为表。全局特征信息文件用户在使用特征工程之前，需要提供一份全局的特征信息文件，后续的特征工程、在线模块都会用到该文件。文件数据信息请参见全局特征信息文件。当上传的数据中的特征有变化时，用户需要同步更新该文件。该文件为JSON格式，包含特征名、特征大类、特征值类型。保留已有宽表

来自：帮助中心

查看更多 →
GS_OPT_MODEL

ip地址。 port integer AiEngine端所侦听的端口号。 max_epoch integer 模型每次训练的迭代次数上限。 learning_rate real 模型训练的学习速率，推荐缺省值1。 dim_red real 模型特征维度降维系数。 hidden_units

来自：帮助中心

查看更多 →
GS

ip地址。 port integer AiEngine端所侦听的端口号。 max_epoch integer 模型每次训练的迭代次数上限。 learning_rate real 模型训练的学习速率，推荐缺省值1。 dim_red real 模型特征维度降维系数。 hidden_units

来自：帮助中心

查看更多 →
特征工程

。图5 特征工程服务单击“Publish”，将特征工程发布成服务。发布成功后，会弹出成功提示框，单击“OK”。在菜单栏中，单击“特征工程”，进入“特征工程管理”界面。单击“已发布服务”页签，查看特征工程服务，如图6所示。图6 特征工程服务单击特征工程服务行对应“操作”列的图标。

来自：帮助中心

查看更多 →
特征操作接口

"failure": [] } 状态码状态码描述 200 successful operation. 400 Bad Request. 500 Internal Server Error. 错误码请参见错误码。父主题：特征管理

来自：帮助中心

查看更多 →
特征工程

特征工程如何选中全量特征列？算法工程处理的时候必须要先采样吗？特征处理操作完成后怎么应用于数据集全量数据？特征工程和算法工程的关系？ JupyterLab环境异常怎么处理？父主题：常见问题

来自：帮助中心

查看更多 →