数据仓库服务 GaussDB(DWS)

 

GaussDB(DWS)是一款具备分析及混合负载能力的分布式数据库,支持x86和Kunpeng硬件架构,支持行存储与列存储,提供GB~PB级数据分析能力、多模分析和实时处理能力,用于数据仓库、数据集市、实时分析、实时决策和混合负载等场景,广泛应用于汽车、制造、零售、物流、互联网、金融、政府、电信等行业分析决策系统

 
 

    数据仓库表设计案例 更多内容
  • 案例:改建分区表

    runtime: 3.587 ms (4 rows) 优化分析 从业务层确认数据(在time字段上)有明显的日期特征,符合分区的特征。重新规划normal_date定义:字段time为分区键、月为间隔单位定义分区normal_date_part。修改后结果如下,性能提升近10倍。

    来自:帮助中心

    查看更多 →

  • 如何设计宽表主键

    如何设计主键 GeminiDB Cassandra是一款分布式数据引擎,宽引擎中的数据均按照主键进行分布。在执行查询时,如果中存在多列主键,系统会从最左边的主键开始匹配。如果主键设置不当,则可能导致主键无法被有效利用,进而产生热点问题,影响查询性能。因此,在数据分区和数据

    来自:帮助中心

    查看更多 →

  • ClickHouse宽表设计

    ClickHouse宽设计 ClickHouse宽设计原则 ClickHouse字段设计 ClickHouse本地设计 ClickHouse分布式设计 ClickHouse分区设计 ClickHouse索引设计 父主题: ClickHouse数据库设计

    来自:帮助中心

    查看更多 →

  • 案例:改建分区表

    runtime: 3.587 ms (4 rows) 优化分析 从业务层确认数据(在time字段上)有明显的日期特征,符合分区的特征。重新规划normal_date定义:字段time为分区键、月为间隔单位定义分区normal_date_part。修改后结果如下,性能提升近10倍。

    来自:帮助中心

    查看更多 →

  • 案例:改建分区表

    案例:改建分区 逻辑上的一张根据某种策略分成多个物理块进行存储,这张逻辑上的称之为分区,每个物理块则称为一个分区。一般对数据和查询都有明显区间段特征的使用分区策略可通过较小不必要的数据扫描,从而提升查询性能 在查询时,可通过分区剪枝技术尽可能减少底层数据扫描,即缩小

    来自:帮助中心

    查看更多 →

  • 案例:改建分区表

    案例:改建分区 现象描述 如下简单SQL语句查询, 性能瓶颈点在dwcjk的Scan上。 优化分析 从业务层确认数据(在cjrq字段上)有明显的日期特征,符合分区的特征。重新规划dwcjk定义:字段cjrq为分区键、天为间隔单位定义分区dwcjk_part。修改后结果如下,性能提升近1倍。

    来自:帮助中心

    查看更多 →

  • 案例

    案例 作为示例,让我们内联变量“message”,将其替换为其初始值设定项 “Hello!”。 重构前 重构后 父主题: 内联变量

    来自:帮助中心

    查看更多 →

  • 案例

    案例 作为示例,让我们将变量 “message” 重命名为“greeting”。 重构前 重构后 父主题: 变量重命名

    来自:帮助中心

    查看更多 →

  • 获取数据仓库列表信息

    获取 数据仓库 信息 功能介绍 获取数据仓库 URI GET /v1.0/{project_id}/common/warehouses 1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目id,获取方法请参见获取项目ID 2 Query参数

    来自:帮助中心

    查看更多 →

  • GaussDB(DWS)表设计规则

    支持的并发度。通过对关联条件和分组条件的仔细设计,能够尽可能的减少不必要的数据shuffle。 选择存储方案 【建议】的存储类型是定义设计的第一步,用户业务类型是决定的存储类型的主要因素,存储类型的选择依据请参考1。 1 的存储类型及场景 存储模型 优点 缺点 适用场景

    来自:帮助中心

    查看更多 →

  • GaussDB(DWS)表设计规则

    支持的并发度。通过对关联条件和分组条件的仔细设计,能够尽可能的减少不必要的数据shuffle。 选择存储方案 【建议】的存储类型是定义设计的第一步,用户业务类型是决定的存储类型的主要因素,存储类型的选择依据请参考1。 1 的存储类型及场景 存储类型 适用场景 行存

    来自:帮助中心

    查看更多 →

  • 案例

    案例 定位任意实体 定位类 查询某个类的成员 父主题: 代码搜索

    来自:帮助中心

    查看更多 →

  • 案例

    案例 作为示例,让我们提取字符串“Hello!”到一个新的消息变量中。 重构前 重构后 父主题: 引入变量

    来自:帮助中心

    查看更多 →

  • 数据仓库规格

    标准数仓(DWS 3.0)云盘规格,该规格弹性伸缩,无限算力、无限容量,规格详情请参见3。 标准数仓(DWS 3.0)本地盘规格,该规格存储容量固定,不能够进行磁盘扩容和规格变更,只能进行节点扩容,规格详情请参见4。 3 标准数仓(DWS 3.0)云盘规格 规格名称 CPU架构 vCPU 内存(GB)

    来自:帮助中心

    查看更多 →

  • 数据仓库类型

    备注1:存算分离数据存储在OBS上,无需重分布,但是元数据和索引存储在本地,仍然需要进行重分布。存算分离在重分布时,只支持读,元数据的重分布时间一般比较短,但是,如果上创建了索引,索引会影响重分布的性能,重分布完成时间与索引的数据量成正比关系,在此期间,只支持读。 实时

    来自:帮助中心

    查看更多 →

  • 视图和关联表设计

    视图和关联设计 视图设计 【建议】除非视图之间存在强依赖关系,否则不建议视图嵌套。 【建议】视图定义中尽量避免排序操作。 关联设计 【建议】之间的关联字段应该尽量少。 【建议】关联字段的数据类型应该保持一致。 【建议】关联字段在命名上,尽可能体现出明显的关联关系。例如,采用同样名称来命名。

    来自:帮助中心

    查看更多 →

  • Hudi表模型设计规范

    流式计算采用MOR。 流式计算为低时延的实时计算,需要高性能的流式读写能力,在Hudi中存在的MOR和COW两种模型中,MOR的流式读写性能相对较好,因此在流式计算场景下采用MOR模型。关于MOR在读写性能的对比关系如下: 对比维度 MOR COW 流式写 高 低 流式读

    来自:帮助中心

    查看更多 →

  • ClickHouse宽表设计原则

    ClickHouse宽设计原则 宽设计原则 由于ClickHouse的宽查询性能较优,且当前ClickHouse可支持上万列的宽横向扩展。 在大部分场景下,有大join以及多join的场景,且多个join的数据变化更新频率较低,这种情况,建议对多个join查询逻辑提

    来自:帮助中心

    查看更多 →

  • 案例:调整中间表存储方式

    案例:调整中间存储方式 在 GaussDB (DWS)中行存使用行执行引擎,列存使用列执行引擎。如果一个SQL语句涉及的既有行存又有列存,系统会自动选择行执行引擎。由于列执行引擎的性能(除indexscan相关的算子)比行执行引擎性能要好很多,因此一般建议使用列存。特别

    来自:帮助中心

    查看更多 →

  • 案例:调整中间表存储方式

    案例:调整中间存储方式 现象描述 在GaussDB中行存天然的使用行执行引擎,列存天然的使用列执行引擎。如果一个SQL语句涉及的既有行存又有列存,系统会自动选择行执行引擎。由于列执行引擎的性能(除indexscan相关的算子)比行执行引擎性能要好很多,因此一般建议使用

    来自:帮助中心

    查看更多 →

  • 案例:调整中间表存储方式

    案例:调整中间存储方式 在GaussDB(DWS)中行存使用行执行引擎,列存使用列执行引擎。如果一个SQL语句涉及的既有行存又有列存,系统会自动选择行执行引擎。由于列执行引擎的性能(除indexscan相关的算子)比行执行引擎性能要好很多,因此一般建议使用列存。特别

    来自:帮助中心

    查看更多 →

共105条
看了本文的人还看了