数据仓库特征理解_特征选择-华为云

GaussDB(DWS)是一款具备分析及混合负载能力的分布式数据库，支持x86和Kunpeng硬件架构，支持行存储与列存储，提供GB~PB级数据分析能力、多模分析和实时处理能力，用于数据仓库、数据集市、实时分析、实时决策和混合负载等场景，广泛应用于汽车、制造、零售、物流、互联网、金融、政府、电信等行业分析决策系统

新客秒杀 2核2G 2M L实例

38元/年

普惠上云领千元上云礼券

立即前往

企业专享 X实例 4核8G 5M

888元/年

热门域名 1元随心购

1元/年起

免费体验中心

90+款云产品，最长可无限期免费试用

个人用户企业用户

免费

Flexus应用服务器L实例

即开即用，轻松运维，简单上云

新用户专享限购1台

¥0.00

云数据库免费试用

金融核心交易系统、政企OA办公等场景适用

注册申请

¥0.00

域名注册服务Domains

.com .cn多款热门域名

新用户专享限购1个

立即前往

华为云企业邮箱免费试用

即开即用，不限账号数

无限邮箱容量 4GB超大附件

¥0.00

免费试用

会打字就会建站

3300+模板，30000+企业选择

立即购买

跨境电商建站

10分钟快速建站，低成本开启跨境生意

试用14天跨境电商

￥0.00

/次

好会计，免费试用

全场景智能报销

免费体验15天

¥0.00

元/年

零代码构建平台

创建nocosys平台客户账号

智能协作企业办公

¥0.00

元/次

数据仓库特征理解更多内容

特征选择

特征选择删除列删除特征列的场景有很多，例如：两个特征呈线性变化关系，为减少模型训练的开销，删除其中一个特征列。操作步骤如下所示。单击界面右上角的图标，选择“数据处理 > 特征选择 > 删除列”，界面新增“删除列”内容。对应参数说明，如表1所示。表1 参数说明参数参数说明

来自：帮助中心

查看更多 →
筛选特征

筛选特征样本对齐执行完成后单击下一步进入“特征选择”页面，这一步企业A需要选出企业A自己和大数据厂商B的特征及标签用于后续的训练。企业A可以选择特征及标签后“启动分箱和IV计算”，通过联邦的统计算法计算出所选特征的iv值，一般而言iv值较高的特征更有区分性，应该作为首选的训练

来自：帮助中心

查看更多 →
特征操作

检查“已选择特征”是否为用户选择的特征列。配置“变换特征数”，保留指定“变换特征数”的特征列。单击“确定”，执行信息熵。在“特征操作流总览”区域会新增一个“信息熵”节点。新增特征新增特征支持用户基于已有的特征列，按照样本数据行的维度，通过求和、求均值，构造出新的特征列。例如，两个特征列ID1（2

来自：帮助中心

查看更多 →
特征画像

。这些类别，对应到后面的特征选择、算法推荐，会有不同的策略，有效提升模型的构建效率。单击“选择数据”左下方的“特征画像”。新增“特征画像”内容，如图1所示。图1 特征画像单击“特征画像”代码框左侧的图标，运行代码。通过运行结果左侧两个图可以直观的看一下原始数据和数据的密

来自：帮助中心

查看更多 →
呼叫特征

呼叫特征表1 呼叫特征说明值说明 0 普通客户呼叫 1 来自话务员 2 长途客户呼叫 3 CTI收到网络路由实呼后发起的路由 4 国际长途来话 40 预约呼出 41 预占用呼出 42 预连接呼出 43 虚呼入呼出 44 预览呼出 45 回呼请求 51 内部求助父主题：附录

来自：帮助中心

查看更多 →
语言理解

对文本按照一定的分类体系或标准进行自动分类标记。目前支持对给定文本自动判断是否是广告。情感分析是文本分类的一种，是指针对带有主观描述的文本，自动判断该文本的情感极性类别。情感极性分为正面和负面。针对天气类、报时、新闻类、笑话类、翻译类、提醒类、闹钟类、音乐类共8个领域进行意图理解，对用户的问题进行领域识别并提取领域内的参数。

来自：帮助中心

查看更多 →
需求理解

需求理解行业需求理解针对行业供给侧和需求侧分别分析出对公共服务平台的需求。供给侧，工业数字化技术体系发展呈现出“新四化”的发展趋势，既工业装备智能化，工业网络标准化，工业软件现代化，以及工业数据价值化，为抢抓产业发展的制高点，对公共服务平台提出了当先性的要求。需求侧，面向产业

来自：帮助中心

查看更多 →
特征工程

特征工程特征工程中已经预置了两个特征处理工程，这里暂不使用，会提供端到端的操作流程，帮助用户快速熟悉特征工程界面操作。如果需要了解特征工程操作详情，可查看模型训练服务《用户指南》中的“特征工程”章节内容。无故障硬盘训练数据集特征处理单击菜单栏中的“特征工程”，进入特征工程首页，如图1所示。

来自：帮助中心

查看更多 →
特征工程

行为表。全局特征信息文件用户在使用特征工程之前，需要提供一份全局的特征信息文件，后续的特征工程、在线模块都会用到该文件。文件数据信息请参见全局特征信息文件。当上传的数据中的特征有变化时，用户需要同步更新该文件。该文件为JSON格式，包含特征名、特征大类、特征值类型。保留已有宽表

来自：帮助中心

查看更多 →
特征操作接口

signature_type 是 String 特征类型。最小长度：1 最大长度：150 signature_name 否 String 特征名称。 signature_attributes 否 Array of 表4 objects 特征属性。表4 MetadataAttributeRequest

来自：帮助中心

查看更多 →
特征工程

特征工程如何选中全量特征列？算法工程处理的时候必须要先采样吗？特征处理操作完成后怎么应用于数据集全量数据？特征工程和算法工程的关系？ JupyterLab环境异常怎么处理？父主题：常见问题

来自：帮助中心

查看更多 →
特征工程

特征工程特征工程简介 Python和Spark开发平台 JupyterLab开发平台父主题：用户指南

来自：帮助中心

查看更多 →
特征管理

特征管理特征操作接口父主题：应用模型

来自：帮助中心

查看更多 →
数据仓库

数据仓库华为云数据仓库高级工程师培训父主题：培训服务

来自：帮助中心

查看更多 →
全局特征信息文件

全局特征信息文件在特征工程、在线模块，近线模块时都会用到该全局的特征信息文件。当上传的数据中的特征有变化时，用户需要同步更新该文件。该文件为JSON格式，包含特征名、特征大类、特征值类型。表1 全局特征信息文件字段描述字段名类型描述是否必选 user_features

来自：帮助中心

查看更多 →
数据仓库

数据仓库表1 数据仓库权限权限对应API接口授权项（Action） IAM项目 (Project) 企业项目 (Enterprise Project) 获取数据仓库列表 GET /v1.0/{project_id}/common/warehouses octopus:dataWarehouse:list

来自：帮助中心

查看更多 →
数据仓库

数据仓库获取数据仓库列表信息获取数据仓库的数据列表父主题： API

来自：帮助中心

查看更多 →
理解底层任务

理解底层任务需要站在模型的角度理解相关任务的真实底层任务，并清晰描述任务要求。例如，在文档问答任务中，任务本质不是生成，而是抽取任务，需要让模型“从文档中抽取出问题的答案，不能是主观的理解或解释，不能修改原文的任何符号、字词和格式”，如果使用“请阅读上述文档，并生成以下问题

来自：帮助中心

查看更多 →
特征工程简介

特征工程简介用户可以通过特征工程对数据集进行数据处理、特征组合、特征转换等特征处理，最大限度的从原始数据中提取特征以供模型训练使用。此外，用户还可以将优质的特征工程发布成服务，以服务的形式对具备完全相同特征的数据进行预处理。特征工程相关的基本概念：特征工程：对数据进行特征处理操作的工程。

来自：帮助中心

查看更多 →
华为语言理解

分类结果的可靠程度。意图理解针对天气类、报时、新闻类、笑话类、翻译类、提醒类、闹钟类、音乐类8个领域进行意图理解。意图理解包括对用户的问题，陈述进行领域识别以及对所对应领域所包含的实体进行抽取。输入参数用户配置意图理解执行动作，相关参数说明如表16所示。表16 意图理解输入参数说明参数

来自：帮助中心

查看更多 →
创建特征工程

创建特征工程用户可以在“数据集详情”页面基于数据集实例新建特征工程，对数据集执行特征操作；也可以在“特征工程管理”页面新建特征工程。我们以在“特征工程管理”页面创建特征工程为例，操作步骤如下。单击“特征工程管理”页面的。弹出“特征处理”对话框。如图1所示。图1 创建特征工程

来自：帮助中心

查看更多 →