机器学习字符串变量变成特征

特征选择

特征选择删除列删除特征列的场景有很多，例如：两个特征呈线性变化关系，为减少模型训练的开销，删除其中一个特征列。操作步骤如下所示。单击界面右上角的图标，选择“数据处理 > 特征选择 > 删除列”，界面新增“删除列”内容。对应参数说明，如表1所示。表1 参数说明参数参数说明

来自：帮助中心

查看更多 →
AI开发基本概念

AI开发基本概念机器学习常见的分类有3种：监督学习：利用一组已知类别的样本调整分类器的参数，使其达到所要求性能的过程，也称为监督训练或有教师学习。常见的有回归和分类。非监督学习：在未加标签的数据中，试图找到隐藏的结构。常见的有聚类。强化学习：智能系统从环境到行为映射的学习，以使奖励信号（强化信号）函数值最大。

来自：帮助中心

查看更多 →
创建数据预处理作业

假设您有如下数据集（只展示部分数据），由于数据不够完整，如job、gender等字段均存在一定程度的缺失。为了不让机器理解形成偏差、以达到机器学习的使用标准，需要基于对数据的理解，对数据进行特征预处理。例如： job字段是多类别的变量，其值0、1、2实际没有大小之分，一般会将该特征转换成向量，如值为0用向量[1, 0

来自：帮助中心

查看更多 →
概述

同特征的多行样本进行可信联邦学习，联合建模。模型评估评估训练得出的模型权重在某一数据集上的预测输出效果。纵向联邦机器学习纵向联邦机器学习，适用于参与者训练样本ID重叠较多，而数据特征重叠较少的情况，联合多个参与者的共同样本的不同数据特征进行可信联邦学习，联合建模。概念术语

来自：帮助中心

查看更多 →
筛选特征

根据计算得出的iv值，企业A调整了训练使用的特征，没有选用双方提供的特征全集，去掉了部分iv值较低的特征，减少了无用的计算消耗。父主题：使用 TICS 可信联邦学习进行联邦建模

来自：帮助中心

查看更多 →
特征操作

检查“已选择特征”是否为用户选择的特征列。配置“变换特征数”，保留指定“变换特征数”的特征列。单击“确定”，执行信息熵。在“特征操作流总览”区域会新增一个“信息熵”节点。新增特征新增特征支持用户基于已有的特征列，按照样本数据行的维度，通过求和、求均值，构造出新的特征列。例如，两个特征列ID1（2

来自：帮助中心

查看更多 →
特征画像

。这些类别，对应到后面的特征选择、算法推荐，会有不同的策略，有效提升模型的构建效率。单击“选择数据”左下方的“特征画像”。新增“特征画像”内容，如图1所示。图1 特征画像单击“特征画像”代码框左侧的图标，运行代码。通过运行结果左侧两个图可以直观的看一下原始数据和数据的密

来自：帮助中心

查看更多 →
呼叫特征

呼叫特征表1 呼叫特征说明值说明 0 普通客户呼叫 1 来自话务员 2 长途客户呼叫 3 CTI收到网络路由实呼后发起的路由 4 国际长途来话 40 预约呼出 41 预占用呼出 42 预连接呼出 43 虚呼入呼出 44 预览呼出 45 回呼请求 51 内部求助父主题：附录

来自：帮助中心

查看更多 →
Standard自动学习

Standard自动学习 ModelArts通过机器学习的方式帮助不具备算法开发能力的业务开发者实现算法的开发，基于迁移学习、自动神经网络架构搜索实现模型自动生成，通过算法实现模型训练的参数自动化选择和模型自动调优的自动学习功能，让零AI基础的业务开发者可快速完成模型的训练和部署。

来自：帮助中心

查看更多 →
可信智能计算服务 TICS

如何创建多方安全计算作业？可信联邦学习作业可信联邦学习作业是可信智能计算服务提供的在保障用户数据安全的前提下，利用多方数据实现的联合建模，曾经也被称为联邦机器学习。横向联邦机器学习横向联邦机器学习，适用于参与者的数据特征重叠较多，而样本ID重叠较少的情况，联合多个参与者的具有相同特征的多行样本进行联邦机器学习，联合建模。

来自：帮助中心

查看更多 →
基本概念

可支持用户进行机器学习、深度学习、模型训练作业开发的框架，如Tensorflow、Spark MLlib、MXNet、PyTorch、华为自研AI框架MindSpore等。数据集某业务下具有相同数据格式的数据逻辑集合。特征操作特征操作主要是对数据集进行特征处理。在旧版体

来自：帮助中心

查看更多 →
变量

变量输入变量输出变量本地变量父主题： Terraform 配置指南

来自：帮助中心

查看更多 →
变量

的属性。递归地嵌套变量引用，提高灵活性。合并多个变量引用以相互覆盖。只能在serverless.yml的values属性中使用变量，而不能使用键属性。因此，您不能在自定义资源部分中使用变量生成动态逻辑ID。从环境变量中引用变量要引用环境变量中的变量，请在serverless

来自：帮助中心

查看更多 →
特征工程

。图5 特征工程服务单击“Publish”，将特征工程发布成服务。发布成功后，会弹出成功提示框，单击“OK”。在菜单栏中，单击“特征工程”，进入“特征工程管理”界面。单击“已发布服务”页签，查看特征工程服务，如图6所示。图6 特征工程服务单击特征工程服务行对应“操作”列的图标。

来自：帮助中心

查看更多 →
特征工程

行为表。全局特征信息文件用户在使用特征工程之前，需要提供一份全局的特征信息文件，后续的特征工程、在线模块都会用到该文件。文件数据信息请参见全局特征信息文件。当上传的数据中的特征有变化时，用户需要同步更新该文件。该文件为JSON格式，包含特征名、特征大类、特征值类型。保留已有宽表

来自：帮助中心

查看更多 →
特征操作接口

"failure": [] } 状态码状态码描述 200 successful operation. 400 Bad Request. 500 Internal Server Error. 错误码请参见错误码。父主题：特征管理

来自：帮助中心

查看更多 →
最新动态

为后续特征选择、模型训练的数据集。公测创建纵向联邦学习作业 2021年3月序号功能名称功能描述阶段相关文档 1 纵向联邦学习纵向联邦机器学习，适用于参与者训练样本ID重叠较多，而数据特征重叠较少的情况，联合多个参与者的共同样本的不同数据特征进行联邦机器学习，联合建模。

来自：帮助中心

查看更多 →
特征工程

特征工程如何选中全量特征列？算法工程处理的时候必须要先采样吗？特征处理操作完成后怎么应用于数据集全量数据？特征工程和算法工程的关系？ JupyterLab环境异常怎么处理？父主题：常见问题

来自：帮助中心

查看更多 →
特征工程

特征工程特征工程简介 Python和Spark开发平台 JupyterLab开发平台父主题：用户指南

来自：帮助中心

查看更多 →
特征管理

特征管理特征操作接口父主题：应用模型

来自：帮助中心

查看更多 →
迁移学习

单击界面右上角的图标，选择“迁移学习 > 特征迁移 > 迁移评估 > 评估迁移算法”。界面新增“评估迁移算法”内容。对应参数说明，如表4所示。表4 参数说明参数参数说明源操作流变量名对应绑定迁移前源数据设置的源操作流变量名。目标操作流变量名对应绑定迁移前目标数据设置的目标操作流变量名。根

来自：帮助中心

查看更多 →