特征工程_项目概览-华为云

项目概览

项目概览界面显示了当前项目的信息概览，如图1所示。图1 项目概览界面项目概览界面包括：数据处理、训练状态统计、训练服务、验证服务的运行状态。数据集、特征工程、模型训练、模型管理、模型验证的列表信息。用户可以直接单击对应列表中的“创建”，创建新的功能模块。项目最新操作的通知信息。父主题：项目创建

来自：帮助中心

查看更多 →
RES支持哪些自定义策略？

RES支持哪些自定义策略？目前RES所支持的推荐策略如下所示：召回策略过滤规则特征工程排序策略近线策略效果评估推荐策略详细信息请参见《推荐系统用户指南》算法介绍及其参数说明章节。父主题：自定义场景

来自：帮助中心

查看更多 →
发布算法工程服务

在弹出的“Publish”框内，设置服务名称“Service Name”。单击“Publish”。在弹出的“Success”框内，单击“OK”。服务发布完成后，可在特征工程首页的“已发布服务”页签内查看。支持基于服务创建任务，详细操作请参见“创建任务”。父主题：数据处理

来自：帮助中心

查看更多 →
作业相关API

作业相关API 提交组合作业提交召回作业提交过滤作业提交特征工程作业提交排序作业提交实时流近线作业提交流式训练作业提交数据质量作业策略参数说明停止算子作业查询作业列表查询作业详情重新执行作业删除作业提交效果评估任务查询效果指标编辑修改作业更新索引结构

来自：帮助中心

查看更多 →
过滤规则

在“离线作业”下，单击“过滤规则”页签，单击该页面做上方“创建”，进入“创建过滤规则”页面。在“创建过滤规则”页面，填写特征工程“名称”、“场景”和“描述”。特征工程名称：请以“Filter-”开始，只能由字母、数字、中划线和下划线组成，并且长度小于64个字符。 “场景”信息可选择您在全局配置页面创建的场景。

来自：帮助中心

查看更多 →
网络智能体 NAIE

为高价值通信应用数据集。模型训练服务为开发者提供电信领域一站式模型开发服务，支持开发者基于训练平台提供的JupyterLab数据探索与特征工程工具、在线VSCode IDE编程工具、AutoML算法选择与超参调优能力、丰富的AI算法框架和在线随时可获取的算力，开发AI算法。业务开发者

来自：帮助中心

查看更多 →
基本概念

法策略。过滤规则过滤规则用于生成推荐的过滤集，包含黑白名单、特征过滤等特性。支持用户在线上推理过程中完成对相关物品的过滤。特征工程特征工程常用于对原始数据进行特征挖掘的处理，形成的结果用于排序策略的训练。排序策略排序策略利用CTR预估或综合性计算的算法给候选集做打分。

来自：帮助中心

查看更多 →
数据探索是什么？近线实时数据如何在数据探索中的报告体现？

告体现？数据探索是针对当前数据源的数据进行挖掘和分析，主要聚焦在特征的分布范围、统计以及特征齐全度等，使用户能够更了解数据，进而指导在特征工程以及相关算法的配置。数据探索是一个离线分析任务，任务有对应的启动时间，由于近线实时数据会实时入库，因此可以通过定时执行数据探索任务来覆盖增量数据。

来自：帮助中心

查看更多 →
效果评估

创建效果评估创建效果评估步骤如下：在“离线作业”的“效果评估”页签，单击左上方“创建”，进入“创建效果评估”页面。在“创建效果评估”页面，填写特征工程“名称”、“场景”和“描述”。效果评估名称：请以“Evaluate-”开始，只能由字母、数字、中划线和下划线组成，并且长度小于64个字符。

来自：帮助中心

查看更多 →
时序预测

为时间列，后面五列为KPI特征列。在项目概览界面，单击菜单栏中的“特征工程”，进入“特征工程”界面。单击界面右上角的“特征处理”，弹出“特征处理”对话框。请根据实际情况，配置如下参数：工程名称：特征工程名称。开发模式：请选择“Jupyterlab交互式开发”。规格：选

来自：帮助中心

查看更多 →
选择数据

，或判断指定的周期是否为时序数据的周期，以及检测时序数据是否平稳。如果开启此开关，运行时间会较长，默认关闭此开关。数据引用变量名当特征工程需要选择多份数据时，使用此参数给每份选定的数据命名，以免产生冲突。均保持默认值即可。单击“选择数据”代码框左侧的图标。运行代码，绑定训练和测试数据实例。

来自：帮助中心

查看更多 →
Notebook开发

单击“Notebook开发”。弹出“Notebook开发”对话框，如图1所示，进行操作名称及操作描述填写。图1 Notebook开发界面单击“确定”。进入“特征工程算法编辑”界面。Notebook算法开发界面同模型训练算法界面，详情请参见编辑代码。用户可以编辑算法文件“**.py”，按“Ctrl+S”保存算法。

来自：帮助中心

查看更多 →
文档导读

本文档详细阐述了NAIE模型训练服务的定位、优势、功能、架构与适用场景等。《快速入门》本文档以硬盘故障检测的模型训练为例，介绍NAIE训练平台使用的全流程，包括数据集、特征工程、模型训练、模型管理和模型验证，使开发者快速熟悉NAIE训练平台。《用户指南》本文档包含了使用NAIE训练平台前的准备工作和如何使用

来自：帮助中心

查看更多 →
组合作业

在对应表的“操作”列中，单击“清除数据”可以删除对应表的数据源。通用格式通用数据由特征工程“初始用户画像-物品画像-标准宽表生成”算子生成。其路径与“初始用户画像-物品画像-标准宽表生成”结果保存路径一致。说明：在使用通用格式数据之前，需要先进行特征工程算子计算。通用格式数据：从用户属性表、物品属性表和

来自：帮助中心

查看更多 →
数据探索

数据探索介绍数据探索是针对当前数据源的数据进行挖掘和分析，主要聚焦在特征的分布范围、统计以及特征齐全度等，使用户能够更了解数据，进而指导在特征工程以及相关算法的配置。数据探索是一个离线分析任务，任务有对应的启动时间，由于增量数据会实时入库，因此可以通过定时执行数据探索任务来覆盖增量数据。

来自：帮助中心

查看更多 →
数据集

15分钟数据集、KPI 60分钟数据集、KPI异常检测数据集。其中鸢尾花原始测试集、KPI 15分钟数据集和KPI 60分钟数据集中包括空值，用户可以通过特征工程进行数据修复，剔除空值。本地上传-文件大小限制为60M，文本支持csv和txt 数据来源选择“本地上传”时可见，表示数据文件所在的用户本地路径。

来自：帮助中心

查看更多 →
全局特征信息文件

全局特征信息文件在特征工程、在线模块，近线模块时都会用到该全局的特征信息文件。当上传的数据中的特征有变化时，用户需要同步更新该文件。该文件为JSON格式，包含特征名、特征大类、特征值类型。表1 全局特征信息文件字段描述字段名类型描述是否必选 user_features

来自：帮助中心

查看更多 →
RES操作流程

RES根据实时发送到DIS上的日志，进行数据计算和处理，更新用户的相关数据。实时日志运行推荐策略创建离线作业创建离线作业包括进行数据质量检测、创建组合作业、特征工程、召回策略、排序策略、过滤规则等作业。运行推荐作业创建在线服务 - 创建在线服务用于部署上线服务、更新模型。配置实时计算的逻辑，包括

来自：帮助中心

查看更多 →
数据探索

设置视觉维度的样式，如颜色、大小、形状等。截取及清空图表展示图截取当前图表图形，截取后的图形展示在左侧空白区域。清空截取的图表图形。单击右下方“保存至特征工程”可将绘制的图表保存至JupyterLab环境编辑区域。特征分析（特征选择）特征选择就是使用算法对特征进行相关性分析，根据结果从众多

来自：帮助中心

查看更多 →
召回策略

初始格式用户操作行为表：单击选择OBS中存储的用户操作行为表。当选择数据格式为csv时，根据情况单击设置数据参数。通用格式通用格式数据：特征工程“初始用户画像-物品画像-标准宽表生成”算子生成的用户推荐系统的数据。从用户特征表、物品特征表以及用户行为表中提取用户、物品特征和用户行

来自：帮助中心

查看更多 →
修订记录

创建模型包编辑模型包上架模型包至AI市场发布推理服务云端推理框架 2019-10-30 JupyterLab环境编辑界面的菜单优化，对应“特征工程”章节内容调整和优化。新增如下章节： Notebook开发创建超参优化服务创建Tensorboard 2019-04-30 第一次正式发布。

来自：帮助中心

查看更多 →