数据仓库服务 GaussDB(DWS)

 

GaussDB(DWS)是一款具备分析及混合负载能力的分布式数据库,支持x86和Kunpeng硬件架构,支持行存储与列存储,提供GB~PB级数据分析能力、多模分析和实时处理能力,用于数据仓库、数据集市、实时分析、实时决策和混合负载等场景,广泛应用于汽车、制造、零售、物流、互联网、金融、政府、电信等行业分析决策系统

 
 

    数据仓库整合表设计 更多内容
  • GaussDB(DWS)表设计规则

    支持的并发度。通过对关联条件和分组条件的仔细设计,能够尽可能的减少不必要的数据shuffle。 选择存储方案 【建议】的存储类型是定义设计的第一步,用户业务类型是决定的存储类型的主要因素,存储类型的选择依据请参考1。 1 的存储类型及场景 存储类型 适用场景 行存

    来自:帮助中心

    查看更多 →

  • 数据使能方案设计

    是国家基础数据中定义的允许值。 业务指标设计 业务指标是用于度量和评估组织或业务活动绩效的衡量标准。它们是量化的、可衡量的数据点,用于衡量业务的成功、进展和现。业务指标通常用来帮助组织了解其绩效状况,监控趋势,做出决策和制定战略。 设计有效的业务指标是一个关键的过程,它需要深入

    来自:帮助中心

    查看更多 →

  • 数据仓库规格

    标准数仓(DWS 3.0)云盘规格,该规格弹性伸缩,无限算力、无限容量,规格详情请参见3。 标准数仓(DWS 3.0)本地盘规格,该规格存储容量固定,不能够进行磁盘扩容和规格变更,只能进行节点扩容,规格详情请参见4。 3 标准数仓(DWS 3.0)云盘规格 规格名称 CPU架构 vCPU 内存(GB)

    来自:帮助中心

    查看更多 →

  • 数据仓库类型

    备注1:存算分离数据存储在OBS上,无需重分布,但是元数据和索引存储在本地,仍然需要进行重分布。存算分离在重分布时,只支持读,元数据的重分布时间一般比较短,但是,如果上创建了索引,索引会影响重分布的性能,重分布完成时间与索引的数据量成正比关系,在此期间,只支持读。 实时

    来自:帮助中心

    查看更多 →

  • 视图和关联表设计

    视图和关联设计 视图设计 【建议】除非视图之间存在强依赖关系,否则不建议视图嵌套。 【建议】视图定义中尽量避免排序操作。 关联设计 【建议】之间的关联字段应该尽量少。 【建议】关联字段的数据类型应该保持一致。 【建议】关联字段在命名上,尽可能体现出明显的关联关系。例如,采用同样名称来命名。

    来自:帮助中心

    查看更多 →

  • Hudi表模型设计规范

    流式计算采用MOR。 流式计算为低时延的实时计算,需要高性能的流式读写能力,在Hudi中存在的MOR和COW两种模型中,MOR的流式读写性能相对较好,因此在流式计算场景下采用MOR模型。关于MOR在读写性能的对比关系如下: 对比维度 MOR COW 流式写 高 低 流式读

    来自:帮助中心

    查看更多 →

  • ClickHouse宽表设计原则

    ClickHouse宽设计原则 宽设计原则 由于ClickHouse的宽查询性能较优,且当前ClickHouse可支持上万列的宽横向扩展。 在大部分场景下,有大join以及多join的场景,且多个join的数据变化更新频率较低,这种情况,建议对多个join查询逻辑提

    来自:帮助中心

    查看更多 →

  • 数据架构支持哪些数据建模方法?

    关注用户如何更快速地完成需求分析,同时具有较好的大规模复杂查询的响应性能。 多维模型是由数字型度量值组成的一张事实连接到一组包含描述属性的多张维度,事实与维度通过主/外键实现关联。 典型的维度模型有星形模型,以及在一些特殊场景下使用的雪花模型。 在DataArts Stu

    来自:帮助中心

    查看更多 →

  • 视图和关联表设计

    视图和关联设计 视图设计 除非视图之间存在强依赖关系,否则不建议视图嵌套。 视图定义中尽量避免排序操作。 关联设计 之间的关联字段应该尽量少。 关联字段的数据类型应该保持一致。 关联字段在命名上,应该可以明显体现出关联关系。例如,采用同样名称来命名。 父主题: 数据库对象设计

    来自:帮助中心

    查看更多 →

  • 视图和关联表设计

    视图和关联设计 视图设计 【建议】除非视图之间存在强依赖关系,否则不建议视图嵌套。 【建议】视图定义中尽量避免排序操作。 关联设计 【建议】之间的关联字段应该尽量少。 【建议】关联字段的数据类型应该保持一致。 【建议】关联字段在命名上,应该可以明显体现出关联关系。例如,采用同样名称来命名。

    来自:帮助中心

    查看更多 →

  • 视图和关联表设计

    视图和关联设计 视图设计 除非视图之间存在强依赖关系,否则不建议视图嵌套。 视图定义中尽量避免排序操作。 关联设计 之间的关联字段应该尽量少。 关联字段的数据类型应该保持一致。 关联字段在命名上,应该可以明显体现出关联关系。例如,采用同样名称来命名。 父主题: 数据库对象设计

    来自:帮助中心

    查看更多 →

  • ClickHouse本地表设计

    ClickHouse本地设计 规则 单(分布式)的记录数不要超过万亿,对于万亿以上的查询,性能较差,且集群维护难度变大。单(本地)不超过百亿。 设计都要考虑到数据的生命周期管理,需要进行TTL属性设置或定期老化清理分区数据。 单的字段建议不要超过5000列。

    来自:帮助中心

    查看更多 →

  • Hudi表索引设计规范

    Hudi索引设计规范 规则 禁止修改索引类型。 Hudi的索引会决定数据存储方式,随意修改索引类型会导致中已有的存量数据与新增数据之间出现数据重复和数据准确性问题。常见的索引类型如下: 布隆索引:Spark引擎独有索引,采用bloomfiter机制,将布隆索引内容写入到Parquet文件的footer中。

    来自:帮助中心

    查看更多 →

  • 视图和关联表设计

    视图和关联设计 视图设计 【建议】除非视图之间存在强依赖关系,否则不建议视图嵌套。 【建议】视图定义中尽量避免排序操作。 关联设计 【建议】之间的关联字段应该尽量少。 【建议】关联字段的数据类型应该保持一致。 【建议】关联字段在命名上,应该可以明显体现出关联关系。例如,采用同样名称来命名。

    来自:帮助中心

    查看更多 →

  • 视图和关联表设计

    视图和关联设计 视图设计 除非视图之间存在强依赖关系,否则不建议视图嵌套。 视图定义中尽量避免排序操作。 关联设计 之间的关联字段应该尽量少。 关联字段的数据类型应该保持一致。 关联字段在命名上,应该可以明显体现出关联关系。例如,采用同样名称来命名。 父主题: 数据库对象设计

    来自:帮助中心

    查看更多 →

  • 视图和关联表设计

    视图和关联设计 视图设计 除非视图之间存在强依赖关系,否则不建议视图嵌套。 视图定义中尽量避免排序操作。 关联设计 之间的关联字段应该尽量少。 关联字段的数据类型应该保持一致。 关联字段在命名上,应该可以明显体现出关联关系。例如,采用同样名称来命名。 父主题: 数据库对象设计

    来自:帮助中心

    查看更多 →

  • Hudi表分区设计规范

    议使用。 建议 事实采用日期分区,维度采用非分区或者大颗粒度的日期分区 是否采用分区要根据的总数据量、增量和使用方式来决定。从的使用属性看事实和维度具有的特点: 事实:数据总量大,增量大,数据读取多以日期做切分,读取一定时间段的数据。 维度:总量相对小,增量小

    来自:帮助中心

    查看更多 →

  • 方案概述

    一体化数据建模能力 支持跨不同数据查询整合,与分布式ETL一体化。提供敏捷建模、智能计算,全面支撑各种数据准备需求。 多款展示工具 符合操作习惯的Web/Excel电子格、分析报告、大屏设计器。 超大数据量处理 利用分布式存储与计算,满足亿级数据的关联查询和计算,帮助企业处理大数据量分析场景。

    来自:帮助中心

    查看更多 →

  • 流程设计

    图1 流程设计1 单击导入,单击下载流程模板。 图2 流程设计2 下载模板如下 1 模板 上级流程 *名称 *责任人 描述 - - - - - - - - 模板参数说明如下: 2 模板参数说明 参数名 说明 上级流程 第一层的流程,其上级流程为空,不用填。 非第一层的流程,其上级

    来自:帮助中心

    查看更多 →

  • 设计中心

    设计中心 解决方案工作台提供设计引擎,用户可在线进行解决方案技术架构设计(含集成架构、部署架构)、信息架构设计。 技术架构设计 信息架构设计 父主题: 标准空间

    来自:帮助中心

    查看更多 →

  • 设计原则

    设计原则 以下是常用的性能优化指导原则: 中心化原则:识别支配性工作量负载功能,并使其处理过程最小化,把注意力集中在对性能影响最大的部分进行提升。 本地化原则:选择靠近的活动、功能和结果的资源;避免通过间接的方式去达到目的,导致通信量或者处理量大辐增加,性能大辐下降。 共享资源:

    来自:帮助中心

    查看更多 →

共105条
看了本文的人还看了