数据仓库服务 GaussDB(DWS)

 

GaussDB(DWS)是一款具备分析及混合负载能力的分布式数据库,支持x86和Kunpeng硬件架构,支持行存储与列存储,提供GB~PB级数据分析能力、多模分析和实时处理能力,用于数据仓库、数据集市、实时分析、实时决策和混合负载等场景,广泛应用于汽车、制造、零售、物流、互联网、金融、政府、电信等行业分析决策系统

 
 

    数据仓库的定义和4大特征 更多内容
  • 特征工程

    特征工程 二值化 卡方选择 派生 特征转换 FP-growth 最小最大规范化 正则化 独热编码 主成分分析 离散化 标准化 字符串标签化 奇异值分解 过滤式特征选择 线性特征重要性 特征尺度变换 特征异常检测 特征异常平滑 gbdt编码模型训练 gbdt编码模型应用 父主题: 数据特征

    来自:帮助中心

    查看更多 →

  • 特征尺度变换

    需要被进行尺度变换特征名 - scale_method 尺度变换方法 "ln" item_spliter 离散型特征,iterm之间分割符 "," kv_spliter 离散型特征KV分割符 ":" 样例 输入数据 配置流程 运行流程 参数设置 输出结果 父主题: 特征工程

    来自:帮助中心

    查看更多 →

  • 数据仓库

    :list √ √ 获取 数据仓库 数据列表 POST /v1.0/{project_id}/common/warehouses/{data_warehouse_id}/data octopus:dataWarehouse:list √ √ 父主题: 权限授权项

    来自:帮助中心

    查看更多 →

  • 数据仓库

    数据仓库 获取数据仓库列表信息 获取数据仓库数据列表 父主题: API

    来自:帮助中心

    查看更多 →

  • 全局特征信息文件

    全局特征信息文件 在特征工程、在线模块,近线模块时都会用到该全局特征信息文件。当上传数据中特征有变化时,用户需要同步更新该文件。该文件为JSON格式,包含特征名、特征大类、特征值类型。 表1 全局特征信息文件字段描述 字段名 类型 描述 是否必选 user_features

    来自:帮助中心

    查看更多 →

  • 特征异常平滑

    特征异常平滑 概述 特征异常平滑算子用于将数据中异常数据平滑到一定区间,可选择采用箱线图、阈值、百分位z-score方法确定平滑区间。 z-score方式:计算所需要平滑特征均值mean标准差std,并引入置信因子cl 平滑区间上界: 平滑区间下界: min-max

    来自:帮助中心

    查看更多 →

  • 获取数据仓库自定义属性列表

    CREATE_TIME(按自定义属性创建时间降序排列) 请求参数 表3 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 是 String 用户Token,通过调用IAM服务获取用户Token接口获取(响应消息头中X-Subject-Token值) 响应参数 状态码:

    来自:帮助中心

    查看更多 →

  • 特征工程简介

    单击图标,可查看Jupyterlab平台环境信息,包括环境名称、状态、规格剩余使用时间,停止运行环境操作。 Spark资源环境信息,用于数据集分析以及Spark特征工程。包括资源ID、状态、规格以及删除资源操作。 查看复制特征工程相关信息,包括任务类型、源特征工程、目标特征工程、创建时间状态等信息。

    来自:帮助中心

    查看更多 →

  • 数据仓库规格

    数据仓库规格 GaussDB (DWS)规格按照产品类型分为标准数仓、实时数仓IoT数仓。其中实时数仓还包含单机版模式。各产品类型不同差异,详情请参见数据仓库类型。 标准数仓(DWS 2.0)规格 标准数仓(DWS 2.0)云盘规格,该规格弹性伸缩,无限算力、无限容量,规格详情请参见表1。

    来自:帮助中心

    查看更多 →

  • 数据仓库类型

    ”,支持单机部署集群部署两种部署方式。 IoT数仓:在标准数仓基础上,提供高效时序计算IoT分析能力,支持实时历史数据关联,内置时序算子,最高40x压缩。适用于物联网IoT等实时分析场景。 GaussDB(DWS)数仓之间暂不支持互相访问,用户可通过创建OBS外表,将两

    来自:帮助中心

    查看更多 →

  • 过滤式特征选择

    过滤式特征选择 概述 过滤式特征选择根据特征对标签重要性对特征进行筛选,特征重要性较高特征,提升训练精度效率。 输入 参数 子参数 参数说明 inputs dataframe inputs为字典类型,dataframe为pyspark中DataFrame类型对象 输出 参数

    来自:帮助中心

    查看更多 →

  • ClickHouse应用场景

    在企业经营分析中,把规模庞大业务数据导入到云数据仓库ClickHouse,对数亿记录或更大规模大宽表和数百维度查询,都能在亚秒级内响应,得到查询结果。让客户随时进行个性化统计不间断分析,辅助商业决策。 访客来源分析展示。 通过批量离线计算对用户访问日志中用户行为进行关联,生成

    来自:帮助中心

    查看更多 →

  • 创建特征工程

    特征工程描述信息。 最多不超过500个字符。 开发模式 特征工程开发环境: Jupyterlab交互式开发 基于JupyterLab特征工程开发环境,具有良好实时交互性,提供通用特征工程和数据分析图形界面操作,以及用户自定义编码能力。适用于数据科学家,以及自定义算法场景。

    来自:帮助中心

    查看更多 →

  • 创建特征工程

    hm”下方“算法工程”,弹出“新建”对话框。 输入“名称”,示例:code-123,单击“确定”。 “code-123”算法工程创建完成,在界面左侧代码目录,可以看到新增“code-123”目录及其相关主文件、子目录等。 不同算法工程,均会有与算法工程同名目录,且同

    来自:帮助中心

    查看更多 →

  • 查询全局特征配置

    String 请求失败时错误信息,请求成功时无此字段。 表4 global_features参数说明 参数名称 参数类型 说明 user_features List 用户特征列表。 item_features List 物品特征列表。 表5 user_features item_features参数说明

    来自:帮助中心

    查看更多 →

  • 查询全局特征配置

    String 请求失败时错误信息,请求成功时无此字段。 表4 global_features参数说明 参数名称 参数类型 说明 user_features List 用户特征列表。 item_features List 物品特征列表。 表5 user_features item_features参数说明

    来自:帮助中心

    查看更多 →

  • 线性特征重要性

    线性特征重要性 概述 用线性模型计算训练数据特征重要性。 输入 参数 子参数 参数说明 inputs dataframe inputs为字典类型,dataframe为pyspark中DataFrame类型对象 输出 特征重要性特征在线性模型中weights,格式是dataFrame。

    来自:帮助中心

    查看更多 →

  • 审视和修改表定义

    审视修改表定义 审视修改表定义概述 使用分区表 选择数据类型 父主题: SQL调优指南

    来自:帮助中心

    查看更多 →

  • 审视和修改表定义

    审视修改表定义 审视修改表定义概述 选择分布方式 选择分布列 使用分区表 选择数据类型 父主题: SQL调优指南

    来自:帮助中心

    查看更多 →

  • 审视和修改表定义

    审视修改表定义 审视修改表定义概述 选择存储模型 选择分布方式 选择分布列 使用局部聚簇 使用分区表 选择数据类型 父主题: SQL调优指南

    来自:帮助中心

    查看更多 →

  • 审视和修改表定义

    审视修改表定义 审视修改表定义概述 使用分区表 选择数据类型 父主题: SQL调优指南

    来自:帮助中心

    查看更多 →

共105条
看了本文的人还看了