数据仓库服务 GaussDB(DWS)

 

GaussDB(DWS)是一款具备分析及混合负载能力的分布式数据库,支持x86和Kunpeng硬件架构,支持行存储与列存储,提供GB~PB级数据分析能力、多模分析和实时处理能力,用于数据仓库、数据集市、实时分析、实时决策和混合负载等场景,广泛应用于汽车、制造、零售、物流、互联网、金融、政府、电信等行业分析决策系统

 
 

    数据仓库四大特征的含义 更多内容
  • 特征工程

    特征工程 二值化 卡方选择 派生 特征转换 FP-growth 最小最大规范化 正则化 独热编码 主成分分析 离散化 标准化 字符串标签化 奇异值分解 过滤式特征选择 线性特征重要性 特征尺度变换 特征异常检测 特征异常平滑 gbdt编码模型训练 gbdt编码模型应用 父主题: 数据特征

    来自:帮助中心

    查看更多 →

  • 特征尺度变换

    需要被进行尺度变换特征名 - scale_method 尺度变换方法 "ln" item_spliter 离散型特征,iterm之间分割符 "," kv_spliter 离散型特征KV分割符 ":" 样例 输入数据 配置流程 运行流程 参数设置 输出结果 父主题: 特征工程

    来自:帮助中心

    查看更多 →

  • 全局特征信息文件

    全局特征信息文件 在特征工程、在线模块,近线模块时都会用到该全局特征信息文件。当上传数据中特征有变化时,用户需要同步更新该文件。该文件为JSON格式,包含特征名、特征大类、特征值类型。 表1 全局特征信息文件字段描述 字段名 类型 描述 是否必选 user_features

    来自:帮助中心

    查看更多 →

  • 特征异常平滑

    特征异常平滑 概述 特征异常平滑算子用于将数据中异常数据平滑到一定区间,可选择采用箱线图、阈值、百分位和z-score方法确定平滑区间。 z-score方式:计算所需要平滑特征均值mean和标准差std,并引入置信因子cl 平滑区间上界: 平滑区间下界: min-max

    来自:帮助中心

    查看更多 →

  • 创建项目公开至组的参数是什么含义?

    创建项目公开至组参数是什么含义? 用户在创建IAM用户时候会涉及到用户组概念。将IAM用户加入指定用户组,则IAM用户和此用户组所有用户权限相同。 创建项目时选择公开至组,这个组即是当前IAM用户所属用户组。勾选用户组后,此组内所有的IAM用户都可以看到当前IAM用

    来自:帮助中心

    查看更多 →

  • 数据仓库

    octopus:dataWarehouse:list √ √ 获取 数据仓库 数据列表 POST /v1.0/{project_id}/common/warehouses/{data_warehouse_id}/data octopus:dataWarehouse:list √ √ 父主题: 权限和授权项

    来自:帮助中心

    查看更多 →

  • 数据仓库

    数据仓库 获取数据仓库列表信息 获取数据仓库数据列表 父主题: API

    来自:帮助中心

    查看更多 →

  • 特征工程简介

    特征工程处理数据集计算平台。 创建人 发布服务用户名。 创建时间 发布服务时间。 活动时间 最新执行特征工程任务时间。 简介 特征工程服务简介。 查看特征工程服务详情,包括特征工程任务列表信息。 创建特征工程任务。 删除特征工程服务。 父主题: 特征工程

    来自:帮助中心

    查看更多 →

  • 过滤式特征选择

    过滤式特征选择 概述 过滤式特征选择根据特征对标签重要性对特征进行筛选,特征重要性较高特征,提升训练精度和效率。 输入 参数 子参数 参数说明 inputs dataframe inputs为字典类型,dataframe为pyspark中DataFrame类型对象 输出 参数

    来自:帮助中心

    查看更多 →

  • 特征工程和算法工程的关系?

    特征工程和算法工程关系? 用户创建特征工程时候,进入特征工程,可以看到系统自动创建特征工程同名算法工程。支持在同一个特征工程中创建多个算法工程,操作如下所示: 在JupyterLab环境编辑界面,单击界面左上角“File > New Launcher”,界面右侧新增“

    来自:帮助中心

    查看更多 →

  • 数据仓库规格

    数据仓库规格 GaussDB (DWS)规格按照产品类型分为标准数仓、实时数仓和IoT数仓。其中实时数仓还包含单机版模式。各产品类型不同差异,详情请参见数据仓库类型。 标准数仓(DWS 2.0)规格 标准数仓(DWS 2.0)云盘规格,该规格弹性伸缩,无限算力、无限容量,规格详情请参见表1。

    来自:帮助中心

    查看更多 →

  • 数据仓库类型

    数据仓库类型 产品类型概述 标准数仓(DWS 2.0):面向数据分析场景,为用户提供高性能、高扩展、高可靠、高安全、易运维企业级数仓服务,支持2048节点、20PB级超大规模数据分析能力。支持冷热数据分析,存储、计算弹性伸缩,并按需、按量计价,为用户提供弹性灵活、极致性价比

    来自:帮助中心

    查看更多 →

  • 安全管理中的数据分层、实体和属性的含义是什么?

    安全管理中数据分层、实体和属性含义是什么? 数据分层用于存放数据实体,数据实体类似于数据库表,实体属性类似于数据库表各个字段。通过设置安全管理平台数据分层、实体和属性密级,可以控制用户对数据访问权限。 父主题: 安全管理

    来自:帮助中心

    查看更多 →

  • 线性特征重要性

    线性特征重要性 概述 用线性模型计算训练数据特征重要性。 输入 参数 子参数 参数说明 inputs dataframe inputs为字典类型,dataframe为pyspark中DataFrame类型对象 输出 特征重要性和特征在线性模型中weights,格式是dataFrame。

    来自:帮助中心

    查看更多 →

  • 创建特征工程

    特征工程描述信息。 最多不超过500个字符。 开发模式 特征工程开发环境: Jupyterlab交互式开发 基于JupyterLab特征工程开发环境,具有良好实时交互性,提供通用特征工程和数据分析图形界面操作,以及用户自定义编码能力。适用于数据科学家,以及自定义算法场景。

    来自:帮助中心

    查看更多 →

  • 创建特征工程

    hm”下方“算法工程”,弹出“新建”对话框。 输入“名称”,示例:code-123,单击“确定”。 “code-123”算法工程创建完成,在界面左侧代码目录,可以看到新增“code-123”目录及其相关主文件、子目录等。 不同算法工程,均会有与算法工程同名目录,且同

    来自:帮助中心

    查看更多 →

  • 查询全局特征配置

    String 全局特征文件OBS路径。 响应消息 响应参数请参见表3。 表3 响应参数说明 参数名称 参数类型 说明 is_success Boolean 请求是否成功。 global_features Object 全局特征表4。 error_code String 请求失败时错误码,请求成功时无此字段。

    来自:帮助中心

    查看更多 →

  • 查询全局特征配置

    String 全局特征文件OBS路径。 响应消息 响应参数请参见表3。 表3 响应参数说明 参数名称 参数类型 说明 is_success Boolean 请求是否成功。 global_features Object 全局特征表4。 error_code String 请求失败时错误码,请求成功时无此字段。

    来自:帮助中心

    查看更多 →

  • GaussDB(DWS)中“算子下盘”是什么含义?

    ,导致作业不稳定,因此需要对查询语句作业内存使用进行限制,保证作业运行稳定性。 假如作业想要使用500M内存,但实际上因为内存限制最终只分配到300M内存,则需要把临时不用数据写到磁盘上,内存中只保留正在使用数据,这就是中间数据落盘由来。当发生中间数据落盘时,称之为算子

    来自:帮助中心

    查看更多 →

  • 提交特征工程作业

    时必填。取值范围[0,1]。 待提取用户特征 (user_features) 是 JSONArray 从全局特征文件提取输入用户特征,对不同类型特征进行相应处理,处理后数据用于排序模型训练。 特征必须来自用户属性配置表中定义特征。 [{ "feature_name": "age"

    来自:帮助中心

    查看更多 →

  • 云审计中的“reserveVolume”事件是什么含义

    云审计 “reserveVolume”事件是什么含义 在挂载云硬盘前,系统会调用云硬盘reserveVolume接口,检查云硬盘是否可用于挂载。如果处于可挂载状态,那么云硬盘状态就会变为attaching,防止与别的操作冲突。 父主题: 云硬盘通用问题

    来自:帮助中心

    查看更多 →

共105条
看了本文的人还看了