数据仓库表设计案例_表设计-华为云

GaussDB(DWS)是一款具备分析及混合负载能力的分布式数据库，支持x86和Kunpeng硬件架构，支持行存储与列存储，提供GB~PB级数据分析能力、多模分析和实时处理能力，用于数据仓库、数据集市、实时分析、实时决策和混合负载等场景，广泛应用于汽车、制造、零售、物流、互联网、金融、政府、电信等行业分析决策系统

新客秒杀 2核2G 2M L实例

38元/年

普惠上云领千元上云礼券

立即前往

企业专享 X实例 4核8G 5M

888元/年

热门域名 1元随心购

1元/年起

免费体验中心

90+款云产品，最长可无限期免费试用

个人用户企业用户

免费

Flexus应用服务器L实例

即开即用，轻松运维，简单上云

新用户专享限购1台

¥0.00

云数据库免费试用

金融核心交易系统、政企OA办公等场景适用

注册申请

¥0.00

域名注册服务Domains

.com .cn多款热门域名

新用户专享限购1个

立即前往

华为云企业邮箱免费试用

即开即用，不限账号数

无限邮箱容量 4GB超大附件

¥0.00

免费试用

会打字就会建站

3300+模板，30000+企业选择

立即购买

跨境电商建站

10分钟快速建站，低成本开启跨境生意

试用14天跨境电商

￥0.00

/次

好会计，免费试用

全场景智能报销

免费体验15天

¥0.00

元/年

零代码构建平台

创建nocosys平台客户账号

智能协作企业办公

¥0.00

元/次

数据仓库表设计案例更多内容

表设计

以防可能出现的数据溢出。表1 表的分区方式及使用场景分区方式描述 Range 表数据通过范围进行分区。 Interval 表数据通过范围进行分区，超出范围的会自动根据间隔创建新的分区。 List 表数据通过指定列按照具体值进行分区。 Hash 表数据通过Hash散列方式进行分区。

来自：帮助中心

查看更多 →
表设计

组条件的仔细设计，能够尽可能的减少不必要的数据shuffle。选择分布方案表的分布方式的选择如表2 表的分布方式及使用场景所示。表1 表的分布方式及使用场景分布方式描述适用场景 Hash 表数据通过Hash方式散列到集群中的所有DN上。数据量较大的事实表。 Replication

来自：帮助中心

查看更多 →
表设计

防止可能出现的数据溢出。表1 表的分区方式及使用场景分区方式描述 Range 表数据通过范围进行分区。 Interval 表数据通过范围进行分区，超出范围的会自动根据间隔创建新的分区。 List 表数据通过指定列按照具体值进行分区。 Hash 表数据通过Hash散列方式进行分区。

来自：帮助中心

查看更多 →
表设计

【建议】表的分布方式的选择一般遵循以下原则：表2 表的分布方式及使用场景分布方式描述适用场景 Hash 表数据通过Hash方式散列到集群中的所有DN上。数据量较大的事实表。 Replication 集群中每一个DN都有一份全量表数据。维度表、数据量较小的事实表。 Range

来自：帮助中心

查看更多 →
表设计

关联条件和分组条件的仔细设计，能够尽可能的减少不必要的数据shuffle。选择分布方案表的分布方式的选择如表1所示。表1 表的分布方式及使用场景分布方式描述适用场景 Hash 表数据通过Hash方式散列到集群中的所有DN上。数据量较大的事实表。 Replication

来自：帮助中心

查看更多 →
表设计

【建议】表的存储类型是表定义设计的第一步，客户业务类型是决定表的存储类型的主要因素，表存储类型的选择依据请参考表1。表1 表的存储类型及场景存储类型适用场景行存点查询（返回记录少，基于索引的简单查询）。增、删、改操作较多的场景。选择分区方案当表中的数据量很大时，应当对表进行分区，一般需要遵循以下原则：

来自：帮助中心

查看更多 →
账表设计

于日后按分类查找报表。图3 账表分类在账表分类上新建报表，设置报表编码、名称等信息。图4 新建账表新建报表后报表是没有样式的，还需要针对新建的报表设计该报表的格式。设计格式之初，首先选择合适的数据模型，然后进行报表格式设计。图5 数据模型选择根据业务需要的样式拖拽左侧

来自：帮助中心

查看更多 →
表设计最佳实践

表设计最佳实践使用分区表选择数据类型父主题：最佳实践

来自：帮助中心

查看更多 →
表设计最佳实践

表设计最佳实践选择分布方式选择分布列使用分区表选择数据类型查看表所在节点父主题：最佳实践

来自：帮助中心

查看更多 →
华为云数据仓库高级工程师培训

DWS相关服务介绍 EIP CDM OBS MRS DGC 数据库对象设计与管理用户数据库表空间 schema 表索引视图 sequence 事务管理事务介绍事务管理事务并发管理事务日志集群管理管理集群管理快照监控集群事件通知资源负载管理资源负载管理介绍基础框架

来自：帮助中心

查看更多 →
成长地图

普通用户执行创建OBS外表语句时报错：permission denied 创建GDS外表失败，报错：ROUNDROBIN distribution type is built-in support. GDS导入失败后，磁盘占用空间增大使用DLF服务创建DWS外表时不支持中文，如何处理

来自：帮助中心

查看更多 →
表设计最佳实践

表设计最佳实践选择存储模型使用分区表选择数据类型父主题：最佳实践

来自：帮助中心

查看更多 →
表设计最佳实践

表设计最佳实践选择存储模型选择分布方式选择分布列使用分区表选择数据类型查看表所在节点父主题：最佳实践

来自：帮助中心

查看更多 →
数据仓库

数据仓库华为云数据仓库高级工程师培训父主题：培训服务

来自：帮助中心

查看更多 →
案例：改建分区表

案例：改建分区表逻辑上的一张表根据某种策略分成多个物理块进行存储，这张逻辑上的表称之为分区表，每个物理块则称为一个分区。一般对数据和查询都有明显区间段特征的表使用分区策略可通过较小不必要的数据扫描，从而提升查询性能在查询时，可通过分区剪枝技术尽可能减少底层数据扫描，即缩小表的

来自：帮助中心

查看更多 →
数据仓库

数据仓库表1 数据仓库权限权限对应API接口授权项（Action） IAM项目 (Project) 企业项目 (Enterprise Project) 获取数据仓库列表 GET /v1.0/{project_id}/common/warehouses octopus:dataWarehouse:list

来自：帮助中心

查看更多 →
数据仓库

数据仓库获取数据仓库列表信息获取数据仓库的数据列表父主题： API

来自：帮助中心

查看更多 →
案例：改建分区表

案例：改建分区表现象描述如下简单SQL语句查询，性能瓶颈点在dwcjk的Scan上。优化分析从业务层确认表数据(在cjrq字段上)有明显的日期特征，符合分区表的特征。重新规划dwcjk表的表定义：字段cjrq为分区键、天为间隔单位定义分区表dwcjk_part。修改后结果如下，性能提升近1倍。

来自：帮助中心

查看更多 →
案例：改建分区表

runtime: 3.587 ms (4 rows) 优化分析从业务层确认表数据(在time字段上)有明显的日期特征，符合分区表的特征。重新规划normal_date表的表定义：字段time为分区键、月为间隔单位定义分区表normal_date_part。修改后结果如下，性能提升近10倍。

来自：帮助中心

查看更多 →
案例：改建分区表

runtime: 3.587 ms (4 rows) 优化分析从业务层确认表数据(在time字段上)有明显的日期特征，符合分区表的特征。重新规划normal_date表的表定义：字段time为分区键、月为间隔单位定义分区表normal_date_part。修改后结果如下，性能提升近10倍。

来自：帮助中心

查看更多 →
如何设计宽表主键

如何设计宽表主键 GeminiDB Cassandra是一款分布式数据引擎，宽表引擎中的数据均按照主键进行分布。在执行查询时，如果表中存在多列主键，系统会从最左边的主键开始匹配。如果主键设置不当，则可能导致主键无法被有效利用，进而产生热点问题，影响查询性能。因此，在数据分区和数据

来自：帮助中心

查看更多 →