特征工程 更多内容
  • 项目概览

    项目概览界面显示了当前项目的信息概览,如图1所示。 图1 项目概览界面 项目概览界面包括: 数据处理、训练状态统计、训练服务、验证服务的运行状态。 数据集、特征工程、模型训练、模型管理、模型验证的列表信息。用户可以直接单击对应列表中的“创建”,创建新的功能模块。 项目最新操作的通知信息。 父主题: 项目创建

    来自:帮助中心

    查看更多 →

  • RES支持哪些自定义策略?

    RES支持哪些自定义策略? 目前RES所支持的推荐策略如下所示: 召回策略 过滤规则 特征工程 排序策略 近线策略 效果评估 推荐策略详细信息请参见《推荐系统用户指南》算法介绍及其参数说明章节。 父主题: 自定义场景

    来自:帮助中心

    查看更多 →

  • 发布算法工程服务

    在弹出的“Publish”框内,设置服务名称“Service Name”。 单击“Publish”。 在弹出的“Success”框内,单击“OK”。 服务发布完成后,可在特征工程首页的“已发布服务”页签内查看。支持基于服务创建任务,详细操作请参见“创建任务”。 父主题: 数据处理

    来自:帮助中心

    查看更多 →

  • 作业相关API

    作业相关API 提交组合作业 提交召回作业 提交过滤作业 提交特征工程作业 提交排序作业 提交实时流近线作业 提交流式训练作业 提交数据质量作业 策略参数说明 停止算子作业 查询作业列表 查询作业详情 重新执行作业 删除作业 提交效果评估任务 查询效果指标 编辑修改作业 更新索引结构

    来自:帮助中心

    查看更多 →

  • 过滤规则

    在“离线作业”下,单击“过滤规则”页签,单击该页面做上方“创建”,进入“创建过滤规则”页面。 在“创建过滤规则”页面,填写特征工程“名称”、“场景”和“描述”。 特征工程名称:请以“Filter-”开始,只能由字母、数字、中划线和下划线组成,并且长度小于64个字符。 “场景”信息可选择您在全局配置页面创建的场景。

    来自:帮助中心

    查看更多 →

  • 网络智能体 NAIE

    为高价值通信应用数据集。 模型训练服务为开发者提供电信领域一站式模型开发服务,支持开发者基于训练平台提供的JupyterLab数据探索与特征工程工具、在线VSCode IDE编程工具、AutoML算法选择与超参调优能力、丰富的AI算法框架和在线随时可获取的算力,开发AI算法。 业务开发者

    来自:帮助中心

    查看更多 →

  • 基本概念

    法策略。 过滤规则 过滤规则用于生成推荐的过滤集,包含黑白名单、 特征过滤等特性。支持用户在线上推理过程中完成对相关物品的过滤。 特征工程 特征工程常用于对原始数据进行特征挖掘的处理,形成的结果用于排序策略的训练。 排序策略 排序策略利用CTR预估或综合性计算的算法给候选集做打分。

    来自:帮助中心

    查看更多 →

  • 数据探索是什么?近线实时数据如何在数据探索中的报告体现?

    告体现? 数据探索是针对当前数据源的数据进行挖掘和分析,主要聚焦在特征的分布范围、统计以及特征齐全度等,使用户能够更了解数据,进而指导在特征工程以及相关算法的配置。 数据探索是一个离线分析任务,任务有对应的启动时间,由于近线实时数据会实时入库,因此可以通过定时执行数据探索任务来覆盖增量数据。

    来自:帮助中心

    查看更多 →

  • 效果评估

    创建效果评估 创建效果评估步骤如下: 在“离线作业”的“效果评估”页签,单击左上方“创建”,进入“创建效果评估”页面。 在“创建效果评估”页面,填写特征工程“名称”、“场景”和“描述”。 效果评估名称:请以“Evaluate-”开始,只能由字母、数字、中划线和下划线组成,并且长度小于64个字符。

    来自:帮助中心

    查看更多 →

  • 时序预测

    为时间列,后面五列为KPI特征列。 在项目概览界面,单击菜单栏中的“特征工程”,进入“特征工程”界面。 单击界面右上角的“特征处理”,弹出“特征处理”对话框。 请根据实际情况,配置如下参数: 工程名称:特征工程名称。 开发模式:请选择“Jupyterlab交互式开发”。 规格:选

    来自:帮助中心

    查看更多 →

  • 选择数据

    ,或判断指定的周期是否为时序数据的周期,以及检测时序数据是否平稳。 如果开启此开关,运行时间会较长,默认关闭此开关。 数据引用变量名 当特征工程需要选择多份数据时,使用此参数给每份选定的数据命名,以免产生冲突。 均保持默认值即可。 单击“选择数据”代码框左侧的图标。运行代码,绑定训练和测试 数据实例

    来自:帮助中心

    查看更多 →

  • Notebook开发

    单击“Notebook开发”。 弹出“Notebook开发”对话框,如图1所示,进行操作名称及操作描述填写。 图1 Notebook开发界面 单击“确定”。 进入“特征工程算法编辑”界面。Notebook算法开发界面同模型训练算法界面,详情请参见编辑代码。用户可以编辑算法文件“**.py”,按“Ctrl+S”保存算法。

    来自:帮助中心

    查看更多 →

  • 文档导读

    本文档详细阐述了NAIE模型训练服务的定位、优势、功能、架构与适用场景等。 《快速入门》 本文档以硬盘故障检测的模型训练为例,介绍NAIE训练平台使用的全流程,包括数据集、特征工程、模型训练、模型管理和模型验证,使开发者快速熟悉NAIE训练平台。 《用户指南》 本文档包含了使用NAIE训练平台前的准备工作和如何使用

    来自:帮助中心

    查看更多 →

  • 组合作业

    在对应表的“操作”列中,单击“清除数据”可以删除对应表的数据源。 通用格式 通用数据由特征工程“初始用户画像-物品画像-标准宽表生成”算子生成。其路径与“初始用户画像-物品画像-标准宽表生成”结果保存路径一致。 说明: 在使用通用格式数据之前,需要先进行特征工程算子计算。 通用格式数据:从用户属性表、物品属性表和

    来自:帮助中心

    查看更多 →

  • 数据探索

    数据探索介绍 数据探索是针对当前数据源的数据进行挖掘和分析,主要聚焦在特征的分布范围、统计以及特征齐全度等,使用户能够更了解数据,进而指导在特征工程以及相关算法的配置。 数据探索是一个离线分析任务,任务有对应的启动时间,由于增量数据会实时入库,因此可以通过定时执行数据探索任务来覆盖增量数据。

    来自:帮助中心

    查看更多 →

  • 数据集

    15分钟数据集、KPI 60分钟数据集、KPI异常检测数据集。 其中鸢尾花原始测试集、KPI 15分钟数据集和KPI 60分钟数据集中包括空值,用户可以通过特征工程进行数据修复,剔除空值。 本地上传-文件大小限制为60M,文本支持csv和txt 数据来源选择“本地上传”时可见,表示数据文件所在的用户本地路径。

    来自:帮助中心

    查看更多 →

  • 全局特征信息文件

    全局特征信息文件 在特征工程、在线模块,近线模块时都会用到该全局的特征信息文件。当上传的数据中的特征有变化时,用户需要同步更新该文件。该文件为JSON格式,包含特征名、特征大类、特征值类型。 表1 全局特征信息文件字段描述 字段名 类型 描述 是否必选 user_features

    来自:帮助中心

    查看更多 →

  • RES操作流程

    RES根据实时发送到DIS上的日志,进行数据计算和处理,更新用户的相关数据。 实时日志 运行推荐策略 创建离线作业 创建离线作业包括进行数据质量检测、创建组合作业、特征工程、召回策略、排序策略、过滤规则等作业。 运行推荐作业 创建在线服务 - 创建在线服务用于部署上线服务、更新模型。配置实时计算的逻辑,包括

    来自:帮助中心

    查看更多 →

  • 召回策略

    初始格式 用户操作行为表:单击选择OBS中存储的用户操作行为表。当选择数据格式为csv时,根据情况单击设置数据参数。 通用格式 通用格式数据:特征工程“初始用户画像-物品画像-标准宽表生成”算子生成的用户推荐系统的数据。从用户特征表、物品特征表以及用户行为表中提取用户、物品特征和用户行

    来自:帮助中心

    查看更多 →

  • 数据探索

    设置视觉维度的样式,如颜色、大小、形状等。 截取及清空图表展示图 截取当前图表图形,截取后的图形展示在左侧空白区域。 清空截取的图表图形。 单击右下方“保存至特征工程”可将绘制的图表保存至JupyterLab环境编辑区域。 特征分析(特征选择) 特征选择就是使用算法对特征进行相关性分析,根据结果从众多

    来自:帮助中心

    查看更多 →

  • 修订记录

    创建模型包 编辑模型包 上架模型包至AI市场 发布推理服务 云端推理框架 2019-10-30 JupyterLab环境编辑界面的菜单优化,对应“特征工程”章节内容调整和优化。 新增如下章节: Notebook开发 创建超参优化服务 创建Tensorboard 2019-04-30 第一次正式发布。

    来自:帮助中心

    查看更多 →

共90条
看了本文的人还看了