特征工程 更多内容
  • 数据准备

    小于:保留或丢弃小于指定值的样本数据行。 等于:保留或丢弃等于指定值的样本数据行。 单击“确定”,执行数据过滤。 数据联合 特征工程数据联合的原理与数据集中数据联合的原理相同。具体请参见数据联合。特征工程以当前打开的特征工程的数据集实例为左表,“数据联合”对话框中数据集的数据为右表。 数据联合操作步骤如下。 单击

    来自:帮助中心

    查看更多 →

  • 离线作业简介

    数据质量是用户在进行离线计算之前使用原始初始格式数据或者通用格式数据检测输入数据是否合法。 数据质量 特征工程 特征工程常用于抽取用户、物品的特征和特定算法的特征生成,一般作为某些算法的前置输入条件。 特征工程 召回策略 召回策略用于生成推荐的候选集,在原始数据中通过算法和规则匹配用户的候选集。

    来自:帮助中心

    查看更多 →

  • AutoML的使用入口有哪些?

    AutoML的使用入口有哪些? 包含如下入口: 在“特征工程”菜单界面,创建JupyterLab特征工程。 在JupyterLab环境编辑界面,单击右上角的图标,选择“模型训练 > 模型训练 > AutoML”,新增AutoML内容,实现零编码使用AutoML。 在“模型训练”菜单界面,创建WebIDE模型训练工程。

    来自:帮助中心

    查看更多 →

  • 文档导读

    训练服务简介 模型训练服务的操作流程简介及访问服务的流程 操作流程 访问训练平台 熟悉模型训练服务中数据集、特征工程、模型训练、及模型管理相关操作 项目创建 数据集 特征工程 模型训练 模型管理 在线对训练模型进行测试验证 模型验证 模型发布成服务后,在线验证模型推理效果 云端推理框架

    来自:帮助中心

    查看更多 →

  • 自定义场景简介

    历史行为过滤等特性。支持用户在线上推理过程中完成对相关物品的过滤。 过滤规则 特征工程 特征工程常用于抽取用户、物品的特征和特定算法的特征生成,一般作为某些算法的前置输入条件。 排序策略-离线特征工程 排序策略 排序策略根据不同的算法模型对召回策略或者近线策略生成的候选集进行重排序,得到推荐候选集列表。

    来自:帮助中心

    查看更多 →

  • 功能介绍

    订阅的数据集。且支持在线查看代码、图片、音视频等多种格式的文件内容。 特征工程 特征工程是模型训练的必要过程,可以实现数据集的特征组合、筛选和转换,最大限度的从数据集中提取关键特征,供模型训练使用。 特征工程集成JupyterLab开发环境,提供数据探索工具,预置数据处理、模型训

    来自:帮助中心

    查看更多 →

  • 排序策略

    训练数据的obs路径 单击选择特征工程排序样本预处理生成的训练数据所在的OBS路径。 即特征工程“排序样本预处理”结果保存路径下具体的训练文件路径。 测试数据的obs路径 单击选择特征工程排序样本预处理生成的测试数据所在的OBS路径。 即特征工程“排序样本预处理”结果保存路径下具体的测试文件路径。

    来自:帮助中心

    查看更多 →

  • 列筛选

    ,可以通过列筛选完成。 列筛选操作步骤如下。 列筛选 单击特征工程操作界面的,弹出“列筛选”对话框,如图1所示。 图1 列筛选 其中,界面说明如下所示: 筛选规则名称:为即将设置的筛选规则设置名称。 筛选成功后,在特征工程操作界面可以单击图标查看筛选历史,筛选记录内的规则名即为此

    来自:帮助中心

    查看更多 →

  • 离线作业

    离线作业 离线作业简介 组合作业 数据质量 特征工程 召回策略 排序策略 过滤规则 效果评估 管理离线作业 删除离线作业 父主题: 用户指南(旧版)

    来自:帮助中心

    查看更多 →

  • 全量数据应用

    支持同时添加多份数据,每份数据必须满足与当前特征工程中的数据特征维度完全相同。 其中,“目标 数据实例 ”为特征处理后生成的数据集实例名称,请根据实际情况配置。 单击“执行”,对数据执行特征操作流。 系统自动生成经过特征处理后的数据,支持用户在“数据集”中查看。 用户可以执行下述操作: 在特征工程详情页面单击“执

    来自:帮助中心

    查看更多 →

  • 常见问题

    常见问题 模型训练服务首页 特征工程 模型训练 模型验证 通用问题 修订记录

    来自:帮助中心

    查看更多 →

  • 操作流程

    操作流程 模型训练服务为用户提供了数据集、特征工程、模型训练、模型管理、模型验证以及云端推理框架能力,服务操作流程如图1所示。 图1 模型训练服务操作流程 父主题: 准备工作

    来自:帮助中心

    查看更多 →

  • 产品功能

    特征抽取,生成推荐系统内部通用的数据格式。经过数据质量检测来确保数据的合法性。提供数据源智能检测,输出数据分布和数据质量信息等,智能完成特征工程。 智能场景 根据业务场景选择对应的智能推荐场景,快速搭建专属推荐系统。主要应用为猜你喜欢、关联推荐、热门推荐。 功能优势: 多维度管理,支持运营规则设置,一站式推荐平台。

    来自:帮助中心

    查看更多 →

  • 数据质量

    数据质量检测日志的保存路径。包括错误数据输出及定位等。 全局特征信息文件 用户在使用数据质量检测算子之前,需要提供一份全局的特征信息文件,后续的特征工程、排序算法、在线服务都会用到该文件。全局特征信息文件需要和画像中字段一致,其中BASIC_INFO为画像表中定义的基本属性字段,TAGS

    来自:帮助中心

    查看更多 →

  • 用户指南

    用户指南 文档导读 模型训练服务简介 准备工作 项目创建 数据集 特征工程 模型训练 模型管理 模型验证 云端推理框架 修订记录

    来自:帮助中心

    查看更多 →

  • 数据采样

    供给模型训练使用。 仅支持对刚导入的数据进行数据采样,不支持对已执行过特征操作的数据进行数据采样。 数据采样操作步骤如下。 在特征工程首页,单击特征工程所在行,对应“操作”列的图标,进入特征操作界面。 单击,弹出“采样”对话框。 配置采样参数如表1所示。 表1 采样参数设置 参数名称

    来自:帮助中心

    查看更多 →

  • 创建自定义场景

    “下一步:排序策略”。 排序策略-离线特征工程 在进行排序之前需要先进行离线特征工程将数据转化为排序所需要的格式。 “创建自定义场景”页面,进入“排序策略”页签,如图4所示。策略的详细参数说明请参见排序策略-离线特征工程。 图4 离线特征工程 创建完成后单击“确认”。保存后的策略会展示在下面的列表中。

    来自:帮助中心

    查看更多 →

  • 算法介绍及参数说明

    算法介绍及参数说明 召回策略 过滤规则 排序策略-离线特征工程 排序策略-离线排序模型 在线服务 效果评估 父主题: 自定义场景

    来自:帮助中心

    查看更多 →

  • 算法工程处理的时候必须要先采样吗?

    作的速度。大数据量操作的时候建议先采样。数据采样后所有的特征操作,都只对采样后的数据进行处理,可以减少特征操作处理的数据量。 父主题: 特征工程

    来自:帮助中心

    查看更多 →

  • 创建在线服务

    值。来源于画像数据,即特征工程中初始用户画像-物品画像-标准宽表生成算子作业输出的数据,用户属性来自于公共配置的全局特征信息文件。如过滤籍贯是广东且性别为男性的用户。 物品属性:指定在物品属性中需要过滤的字段,包含属性名和属性值。来源于画像数据,即特征工程中初始用户画像-物品画像

    来自:帮助中心

    查看更多 →

  • JupyterLab环境异常怎么处理?

    业。需要重启Kernel,恢复正常。Kernel重启,请参考《用户指南》的“JupyterLab环境异常处理”章节进行操作。 父主题: 特征工程

    来自:帮助中心

    查看更多 →

共91条
看了本文的人还看了