数据仓库服务 GaussDB(DWS)

 

GaussDB(DWS)是一款具备分析及混合负载能力的分布式数据库,支持x86和Kunpeng硬件架构,支持行存储与列存储,提供GB~PB级数据分析能力、多模分析和实时处理能力,用于数据仓库、数据集市、实时分析、实时决策和混合负载等场景,广泛应用于汽车、制造、零售、物流、互联网、金融、政府、电信等行业分析决策系统

 
 

    数据仓库特征工程 更多内容
  • 操作流程

    操作流程 模型训练服务为用户提供了数据集、特征工程、模型训练、模型管理、模型验证以及云端推理框架能力,服务操作流程如图1所示。 图1 模型训练服务操作流程 父主题: 准备工作

    来自:帮助中心

    查看更多 →

  • 列筛选

    ,可以通过列筛选完成。 列筛选操作步骤如下。 列筛选 单击特征工程操作界面的,弹出“列筛选”对话框,如图1所示。 图1 列筛选 其中,界面说明如下所示: 筛选规则名称:为即将设置的筛选规则设置名称。 筛选成功后,在特征工程操作界面可以单击图标查看筛选历史,筛选记录内的规则名即为此

    来自:帮助中心

    查看更多 →

  • 排序策略

    训练数据的obs路径 单击选择特征工程排序样本预处理生成的训练数据所在的OBS路径。 即特征工程“排序样本预处理”结果保存路径下具体的训练文件路径。 测试数据的obs路径 单击选择特征工程排序样本预处理生成的测试数据所在的OBS路径。 即特征工程“排序样本预处理”结果保存路径下具体的测试文件路径。

    来自:帮助中心

    查看更多 →

  • JupyterLab环境异常怎么处理?

    业。需要重启Kernel,恢复正常。Kernel重启,请参考《用户指南》的“JupyterLab环境异常处理”章节进行操作。 父主题: 特征工程

    来自:帮助中心

    查看更多 →

  • 无法成功创建数据仓库集群时怎么处理?

    无法成功创建 数据仓库 集群时怎么处理? 检查原因 检查是否用户已经没有配额创建新的数据仓库集群。 联系服务人员 如果无法确定原因并解决问题,请提交工单反馈问题。您可以登录管理控制台,在右上方单击“工单>新建工单”填写并提交工单。 父主题: 集群管理

    来自:帮助中心

    查看更多 →

  • 产品功能

    特征抽取,生成推荐系统内部通用的数据格式。经过数据质量检测来确保数据的合法性。提供数据源智能检测,输出数据分布和数据质量信息等,智能完成特征工程。 智能场景 根据业务场景选择对应的智能推荐场景,快速搭建专属推荐系统。主要应用为猜你喜欢、关联推荐、热门推荐。 功能优势: 多维度管理,支持运营规则设置,一站式推荐平台。

    来自:帮助中心

    查看更多 →

  • 算法工程处理的时候必须要先采样吗?

    作的速度。大数据量操作的时候建议先采样。数据采样后所有的特征操作,都只对采样后的数据进行处理,可以减少特征操作处理的数据量。 父主题: 特征工程

    来自:帮助中心

    查看更多 →

  • 获取数据仓库的数据列表

    获取数据仓库的数据列表 功能介绍 获取数据仓库的数据列表 URI POST /v1.0/{project_id}/common/warehouses/{data_warehouse_id}/data 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String

    来自:帮助中心

    查看更多 →

  • 创建自定义场景

    “下一步:排序策略”。 排序策略-离线特征工程 在进行排序之前需要先进行离线特征工程将数据转化为排序所需要的格式。 “创建自定义场景”页面,进入“排序策略”页签,如图4所示。策略的详细参数说明请参见排序策略-离线特征工程。 图4 离线特征工程 创建完成后单击“确认”。保存后的策略会展示在下面的列表中。

    来自:帮助中心

    查看更多 →

  • RES支持哪些自定义策略?

    RES支持哪些自定义策略? 目前RES所支持的推荐策略如下所示: 召回策略 过滤规则 特征工程 排序策略 近线策略 效果评估 推荐策略详细信息请参见《推荐系统用户指南》算法介绍及其参数说明章节。 父主题: 自定义场景

    来自:帮助中心

    查看更多 →

  • 网络智能体 NAIE

    为高价值通信应用数据集。 模型训练服务为开发者提供电信领域一站式模型开发服务,支持开发者基于训练平台提供的JupyterLab数据探索与特征工程工具、在线VSCode IDE编程工具、AutoML算法选择与超参调优能力、丰富的AI算法框架和在线随时可获取的算力,开发AI算法。 业务开发者

    来自:帮助中心

    查看更多 →

  • 创建在线服务

    值。来源于画像数据,即特征工程中初始用户画像-物品画像-标准宽表生成算子作业输出的数据,用户属性来自于公共配置的全局特征信息文件。如过滤籍贯是广东且性别为男性的用户。 物品属性:指定在物品属性中需要过滤的字段,包含属性名和属性值。来源于画像数据,即特征工程中初始用户画像-物品画像

    来自:帮助中心

    查看更多 →

  • 用户指南

    用户指南 文档导读 模型训练服务简介 准备工作 项目创建 数据集 特征工程 模型训练 模型管理 模型验证 云端推理框架 修订记录

    来自:帮助中心

    查看更多 →

  • 项目概览

    项目概览界面显示了当前项目的信息概览,如图1所示。 图1 项目概览界面 项目概览界面包括: 数据处理、训练状态统计、训练服务、验证服务的运行状态。 数据集、特征工程、模型训练、模型管理、模型验证的列表信息。用户可以直接单击对应列表中的“创建”,创建新的功能模块。 项目最新操作的通知信息。 父主题: 项目创建

    来自:帮助中心

    查看更多 →

  • 算法介绍及参数说明

    算法介绍及参数说明 召回策略 过滤规则 排序策略-离线特征工程 排序策略-离线排序模型 在线服务 效果评估 父主题: 自定义场景

    来自:帮助中心

    查看更多 →

  • 数据质量

    数据质量检测日志的保存路径。包括错误数据输出及定位等。 全局特征信息文件 用户在使用数据质量检测算子之前,需要提供一份全局的特征信息文件,后续的特征工程、排序算法、在线服务都会用到该文件。全局特征信息文件需要和画像中字段一致,其中BASIC_INFO为画像表中定义的基本属性字段,TAGS

    来自:帮助中心

    查看更多 →

  • 作业相关API

    作业相关API 提交组合作业 提交召回作业 提交过滤作业 提交特征工程作业 提交排序作业 提交实时流近线作业 提交流式训练作业 提交数据质量作业 策略参数说明 停止算子作业 查询作业列表 查询作业详情 重新执行作业 删除作业 提交效果评估任务 查询效果指标 编辑修改作业 更新索引结构

    来自:帮助中心

    查看更多 →

  • 数据采样

    供给模型训练使用。 仅支持对刚导入的数据进行数据采样,不支持对已执行过特征操作的数据进行数据采样。 数据采样操作步骤如下。 在特征工程首页,单击特征工程所在行,对应“操作”列的图标,进入特征操作界面。 单击,弹出“采样”对话框。 配置采样参数如表1所示。 表1 采样参数设置 参数名称

    来自:帮助中心

    查看更多 →

  • 奇异值分解

    奇异值分解 概述 奇异值分解(Singular Value Decomposition,SVD)一般用于数据挖掘、建模等领域的特征工程过程,是线性代数中一种重要的矩阵分解方法,奇异值分解算子可将1个矩阵分解为3个矩阵。 比如对于m×n 的矩阵A,可根据以下SVD计算公式得到左奇异向量组成的m×k

    来自:帮助中心

    查看更多 →

  • 获取数据仓库自定义属性列表

    获取数据仓库自定义属性列表 功能介绍 获取数据仓库自定义属性列表 URI GET /v1.0/{project_id}/common/warehouses/custom-attributes 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目id,获取方法请参见获取项目ID

    来自:帮助中心

    查看更多 →

  • 发布算法工程服务

    在弹出的“Publish”框内,设置服务名称“Service Name”。 单击“Publish”。 在弹出的“Success”框内,单击“OK”。 服务发布完成后,可在特征工程首页的“已发布服务”页签内查看。支持基于服务创建任务,详细操作请参见“创建任务”。 父主题: 数据处理

    来自:帮助中心

    查看更多 →

共105条
看了本文的人还看了