机器学习加特征分数下降_离散特征分析-华为云

离散特征分析

离散特征分析概述离散值特征分析通过每个离散特征的gini，entropy，gini gain，information gain，information gain ratio等和每个离散值对应的gini，entropy指标，方便对离散特征进行理解。输入参数子参数参数说明

来自：帮助中心

查看更多 →
特征异常检测

特征异常检测概述特征异常检测的方法包括箱型图（Box-plot）和AVF（Attribute Value Frequency）箱型图用于检测连续值类特征的数据，根据四分位数检测异常特征。 AVF用于检测枚举值类特征的数据，根据枚举特征的取值频率及阈值检测异常特征。箱型图异常检测

来自：帮助中心

查看更多 →
最新动态

为后续特征选择、模型训练的数据集。公测创建纵向联邦学习作业 2021年3月序号功能名称功能描述阶段相关文档 1 纵向联邦学习纵向联邦机器学习，适用于参与者训练样本ID重叠较多，而数据特征重叠较少的情况，联合多个参与者的共同样本的不同数据特征进行联邦机器学习，联合建模。

来自：帮助中心

查看更多 →
GS

续扩展。 model_name name 模型的实例名，每个模型对应AiEngine在线学习进程中的一套参数、训练日志、模型系数。此列需为unique。 datname name 该模型所服务的database名，每个模型只针对单个database。此参数决定训练时所使用的数据。

来自：帮助中心

查看更多 →
GS

续扩展。 model_name name 模型的实例名，每个模型对应AiEngine在线学习进程中的一套参数、训练日志、模型系数。此列需为unique。 datname name 该模型所服务的database名，每个模型只针对单个database。此参数决定训练时所使用的数据。

来自：帮助中心

查看更多 →
提交排序任务API

分解机每个特征对其他域的隐向量都一致，而域感知因子分解机每个特征对其他每个域都会学习一个隐向量，能够达到更高的精度，但也更容易出现过拟合。FFM算法参数请参见域感知因子分解机。深度网络因子分解机，结合了因子分解机和深度神经网络对于特征表达的学习，同时学习高阶和低阶特征组合，从而

来自：帮助中心

查看更多 →
ML Studio简介

，可帮助开发者快速构建具有实用价值的机器学习应用。 MLS为AI开发者提供可视化的操作界面来编排机器学习模型的训练、评估和预测的过程，无缝衔接数据分析和预测应用，为用户的数据挖掘分析业务提供易用、高效、高性能的工具。了解概念算子在MLS中，算子是一种基本功能单元，以ipyn

来自：帮助中心

查看更多 →
GS

续扩展。 model_name name 模型的实例名，每个模型对应aiEngine在线学习进程中的一套参数、训练日志、模型系数。此列需为unique。 datname name 该模型所服务的database名，每个模型只针对单个database。此参数决定训练时所使用的数据。

来自：帮助中心

查看更多 →
特征工程

特征工程如何选中全量特征列？算法工程处理的时候必须要先采样吗？特征处理操作完成后怎么应用于数据集全量数据？特征工程和算法工程的关系？ JupyterLab环境异常怎么处理？父主题：常见问题

来自：帮助中心

查看更多 →
特征工程

特征工程特征工程简介 Python和Spark开发平台 JupyterLab开发平台父主题：用户指南

来自：帮助中心

查看更多 →
特征管理

特征管理特征操作接口父主题：应用模型

来自：帮助中心

查看更多 →
特征工程

特征工程二值化卡方选择派生特征转换 FP-growth 最小最大规范化正则化独热编码主成分分析离散化标准化字符串标签化奇异值分解过滤式特征选择线性特征重要性特征尺度变换特征异常检测特征异常平滑 gbdt编码模型训练 gbdt编码模型应用父主题：数据特征

来自：帮助中心

查看更多 →
特征尺度变换

需要被进行尺度变换的特征名 - scale_method 尺度变换的方法 "ln" item_spliter 离散型特征的，iterm之间的分割符 "," kv_spliter 离散型特征KV的分割符 ":" 样例输入数据配置流程运行流程参数设置输出结果父主题：特征工程

来自：帮助中心

查看更多 →
数据特征分析

由于发布后的数据集不会默认启动数据特征分析，针对数据集的各个版本，需手动启动特征分析任务。在数据特征页签下，单击“启动特征分析”。在弹出的对话框中配置需要进行特征分析的数据集版本，然后单击“确定”启动分析。 “版本选择”，即选择当前数据集的已发布版本。图1 启动数据特征分析任务数据特征分析任务启动

来自：帮助中心

查看更多 →
全局特征信息文件

全局特征信息文件在特征工程、在线模块，近线模块时都会用到该全局的特征信息文件。当上传的数据中的特征有变化时，用户需要同步更新该文件。该文件为JSON格式，包含特征名、特征大类、特征值类型。表1 全局特征信息文件字段描述字段名类型描述是否必选 user_features

来自：帮助中心

查看更多 →
特征异常平滑

无 soften_method 是特征平滑方法，可选z-score,min-max-per,min-max-thresh,boxplot。 "z-score" keep_original 是是否保留原始列，如果保留则新增列，列名为原始列前加'soften_'。 False cl

来自：帮助中心

查看更多 →
查看算子

如图1中红色框所示，预置算子列表目前分为数据特征、输入输出、模型工程三大类。带标志的是算子类别，比如数据特征类，该类包含数据特征的子类数据分析、特征工程、数据处理及其算子。详细的预置算子说明请参考预置算子说明章节。单击算子类对象前图标，即可展开显示子类和算子。双击数据特征类，展开其子类数据分析、特征工程、数据

来自：帮助中心

查看更多 →
AI开发基本概念

AI开发基本概念机器学习常见的分类有3种：监督学习：利用一组已知类别的样本调整分类器的参数，使其达到所要求性能的过程，也称为监督训练或有教师学习。常见的有回归和分类。非监督学习：在未加标签的数据中，试图找到隐藏的结构。常见的有聚类。强化学习：智能系统从环境到行为映射的学习，以使奖励信号（强化信号）函数值最大。

来自：帮助中心

查看更多 →
自动学习

。自动学习的关键技术主要是基于信息熵上限近似模型的树搜索最优特征变换和基于信息熵上限近似模型的贝叶斯优化自动调参。通过这些关键技术，可以从企业关系型（结构化）数据中，自动学习数据特征和规律，智能寻优特征&ML模型及参数，准确性甚至达到专家开发者的调优水平。自动深度学习的关键技术

来自：帮助中心

查看更多 →
特征工程简介

特征工程：对数据进行特征处理操作的工程。特征工程服务：将优质的特征工程发布成服务，用户可以直接调用该服务，对具备完全相同特征的数据进行特征处理。特征工程任务：调用特征工程服务的过程。用户在调用特征工程服务的时候，需要基于特征工程服务新建任务。特征工程管理页面 “特征工程”页面分为两个页签：特征处理工程和已发布服务。

来自：帮助中心

查看更多 →
过滤式特征选择

过滤式特征选择概述过滤式特征选择根据特征对标签的重要性对特征进行筛选，特征重要性较高的特征，提升训练的精度和效率。输入参数子参数参数说明 inputs dataframe inputs为字典类型，dataframe为pyspark中的DataFrame类型对象输出参数

来自：帮助中心

查看更多 →