机器学习离散特征_GS_OPT

GS_OPT_MODEL

ip地址。 port integer AiEngine端所侦听的端口号。 max_epoch integer 模型每次训练的迭代次数上限。 learning_rate real 模型训练的学习速率，推荐缺省值1。 dim_red real 模型特征维度降维系数。 hidden_units

来自：帮助中心

查看更多 →
提交排序任务API

分解机每个特征对其他域的隐向量都一致，而域感知因子分解机每个特征对其他每个域都会学习一个隐向量，能够达到更高的精度，但也更容易出现过拟合。FFM算法参数请参见域感知因子分解机。深度网络因子分解机，结合了因子分解机和深度神经网络对于特征表达的学习，同时学习高阶和低阶特征组合，从而

来自：帮助中心

查看更多 →
全局特征信息文件

全局特征信息文件在特征工程、在线模块，近线模块时都会用到该全局的特征信息文件。当上传的数据中的特征有变化时，用户需要同步更新该文件。该文件为JSON格式，包含特征名、特征大类、特征值类型。表1 全局特征信息文件字段描述字段名类型描述是否必选 user_features

来自：帮助中心

查看更多 →
GS_OPT_MODEL

ip地址。 port integer AiEngine端所侦听的端口号。 max_epoch integer 模型每次训练的迭代次数上限。 learning_rate real 模型训练的学习速率，推荐缺省值1。 dim_red real 模型特征维度降维系数。 hidden_units

来自：帮助中心

查看更多 →
执行作业

横向评估型作业在作业配置页面单击“保存”按钮后，可以直接单击“执行”按钮。用户登录进入计算节点页面。在左侧导航树上依次选择“作业管理 > 可信联邦学习”，打开可信联邦学习作业页面。在“可信联邦学习”页面，查找待执行的作业，单击“执行”，系统自动跳转到“历史作业”页面。图1 执行作业等待执行完成，在“历史作

来自：帮助中心

查看更多 →
特征工程简介

特征工程：对数据进行特征处理操作的工程。特征工程服务：将优质的特征工程发布成服务，用户可以直接调用该服务，对具备完全相同特征的数据进行特征处理。特征工程任务：调用特征工程服务的过程。用户在调用特征工程服务的时候，需要基于特征工程服务新建任务。特征工程管理页面 “特征工程”页面分为两个页签：特征处理工程和已发布服务。

来自：帮助中心

查看更多 →
提交特征工程作业

件夹。全局特征配置文件路径(global_features_information_path) 是 String 该文件为JSON格式，包含特征名、特征大类、特征值类型。全局特征文件详细内容可以通过查询全局特征配置获取。高级设置(writer_parameters) 否 JSON

来自：帮助中心

查看更多 →
数据转换

特征离散化是将特征列连续的样本数据离散化为[0，离散数量-1]区间内的整型数据。操作步骤如下所示。单击界面右上角的图标，选择“数据处理 > 数据转换 > 特征离散化”，界面新增“特征离散化”内容。对应参数说明，如表4所示。表4 参数说明参数参数说明列筛选方式特征列的筛选方式，有如下两种：

来自：帮助中心

查看更多 →
创建特征工程

创建特征工程用户可以在“数据集详情”页面基于数据集实例新建特征工程，对数据集执行特征操作；也可以在“特征工程管理”页面新建特征工程。我们以在“特征工程管理”页面创建特征工程为例，操作步骤如下。单击“特征工程管理”页面的。弹出“特征处理”对话框。如图1所示。图1 创建特征工程

来自：帮助中心

查看更多 →
创建特征工程

6 JupyterLab预置的算子，主要包含数据处理、模型训练以及迁移学习能力。 7 算法工程操作编辑区域。算法工程操作的主文件为后缀名称是“ipynb”的文件。新建算法工程用户创建特征工程时，系统默认在特征工程中，为用户创建了同名的算法工程，如果需要在当前特征工程中，创建多个算法工程，可参考下述步骤操作。

来自：帮助中心

查看更多 →
查询全局特征配置

请求失败时的错误码，请求成功时无此字段。 error_msg String 请求失败时的错误信息，请求成功时无此字段。表4 global_features参数说明参数名称参数类型说明 user_features List 用户特征列表。 item_features List 物品特征列表。表5 user_features

来自：帮助中心

查看更多 →
查询全局特征配置

请求失败时的错误码，请求成功时无此字段。 error_msg String 请求失败时的错误信息，请求成功时无此字段。表4 global_features参数说明参数名称参数类型说明 user_features List 用户特征列表。 item_features List 物品特征列表。表5 user_features

来自：帮助中心

查看更多 →
APP特征信息无效

APP特征信息无效整改通知：您填写的APP公钥或MD5值为无效信息。可能原因：出现此情况，可能您填写的APP公钥或MD5值为无效字段。整改建议：请参考变更备案，填写新的APP公钥或MD5值，确保备案APP的特征信息与实际信息保持一致。父主题： APP信息

来自：帮助中心

查看更多 →
获取数据详情

String id文件地址 config_file_path String 配置文件地址 auto_generate_data Boolean 是否自动生成数据，即纵向联邦学习样本对齐之后的流程是否使用样本对其结果自动过滤。 ext LocalDatasetExtEntity object

来自：帮助中心

查看更多 →
开发数据预处理作业

换等离散型字段：缺失值处理>离散特征编码、缺失值处理>OneHot编码等表1 预处理方法预处理方法名称使用范围功能介绍缺失值处理连续型/离散型针对连续特征有均值、中位数2种填充策略，针对离散特征有众数的填充策略。离散特征编码离散型将字符串形式存储的特征，映射为[0

来自：帮助中心

查看更多 →
AI开发基本概念

AI开发基本概念机器学习常见的分类有3种：监督学习：利用一组已知类别的样本调整分类器的参数，使其达到所要求性能的过程，也称为监督训练或有教师学习。常见的有回归和分类。非监督学习：在未加标签的数据中，试图找到隐藏的结构。常见的有聚类。强化学习：智能系统从环境到行为映射的学习，以使奖励信号（强化信号）函数值最大。

来自：帮助中心

查看更多 →
创建数据集

明文呈现。默认不勾选（作业发起方所属字段不做脱敏）。分布类型：包括连续、离散、MULTIHOT三种特征类型，联邦学习时可能会使用到该信息。离散：离散变量是在任意两个值之间具有可计数的值的数值变量。离散变量始终为数值变量。例如，客户投诉数量或者瑕疵或缺陷数。连续：连续变量是在

来自：帮助中心

查看更多 →
时序预测

会推荐使用深度学习算法，建议选择大规格“8核|32G”，否则模型训练时长会达到1小时。实例：从下拉框中选择“新建一个环境”。单击“创建”，等待Jupyterlab环境创建完成，约需要2分钟。等待Jupyterlab环境创建完成后，单击特征工程所行，对应操作列的图标。进入J

来自：帮助中心

查看更多 →
适用于人工智能与机器学习场景的合规实践

账号下的所有 CTS 追踪器未追踪指定的OBS桶，视为“不合规” mrs-cluster-kerberos-enabled MRS 集群开启kerberos认证 mrs MRS集群未开启kerberos认证，视为“不合规” mrs-cluster-no-public-ip MRS集群未绑定弹性公网IP mrs

来自：帮助中心

查看更多 →
附录

附录名词解释基本概念、云服务简介、专有名词解释：企业主机安全 HSS：是服务器贴身安全管家，通过资产管理、漏洞管理、基线检查、入侵检测、程序运行认证、文件完整性校验，安全运营、网页防篡改等功能，帮助企业更方便地管理主机安全风险，实时发现黑客入侵行为，以及满足等保合规要求。 Web应用防火墙

来自：帮助中心

查看更多 →
查询数据源任务结果

用户连续类型特征统计。 user_str_feature_report Array of StrFeatureReport objects 用户单值离散值类型特征统计。 user_strArray_feature_report Array of StrFeatureReport objects

来自：帮助中心

查看更多 →