数据仓库里表设计规范_表设计规范-华为云

GaussDB(DWS)是一款具备分析及混合负载能力的分布式数据库，支持x86和Kunpeng硬件架构，支持行存储与列存储，提供GB~PB级数据分析能力、多模分析和实时处理能力，用于数据仓库、数据集市、实时分析、实时决策和混合负载等场景，广泛应用于汽车、制造、零售、物流、互联网、金融、政府、电信等行业分析决策系统

普惠上云 2核2G2M云服务器

38元/年

云服务器秒杀 X实例-4核8G5M

338元/年

Flexus L实例 2核2G3M云服务器

68元/年

网站搭建买3年送2年

1元/天

免费体验中心

90+款云产品，最长可无限期免费试用

个人用户企业用户

免费

Flexus应用服务器L实例

即开即用，轻松运维，简单上云

新用户专享限购1台

¥0.00

云数据库免费试用

金融核心交易系统、政企OA办公等场景适用

注册申请

¥0.00

域名注册服务Domains

.com .cn多款热门域名首注1元起

新用户专享限购1个

￥1.00

华为云企业邮箱免费试用

即开即用，不限账号数

无限邮箱容量 4GB超大附件

¥0.00

免费试用

会打字就会建站

3300+模板，30000+企业选择

买2年送1年

¥368.00

跨境电商建站

10分钟快速建站，低成本开启跨境生意

试用14天跨境电商

￥0.00

/次

好会计，免费试用

全场景智能报销

免费体验15天

¥0.00

元/年

零代码构建平台

创建nocosys平台客户账号

智能协作企业办公

¥0.00

元/次

数据仓库里表设计规范更多内容

表设计规范

表设计规范必须指定表分布（DISTRIBUTE BY），表分布策略选择的原则如下：目前提供REPLICATION和HASH两种表分布策略。REPLICATION分布会在每个节点保留一份相同的完整的数据表。HASH分布会根据所提供的分布键值将表数据分布到多个节点中。对于系统配

来自：帮助中心

查看更多 →
库表设计规范

避免使用分区表，如有需要，可以使用多个独立的表代替。分区表的缺点： DDL操作需要锁定所有分区，导致所有分区上操作都被阻塞。当表数据量较大时，对分区表进行DDL或其他运维操作难度大风险高。分区表使用较少，存在未知风险。当单台服务器性能无法满足时，对分区表进行分拆的成本较高。

来自：帮助中心

查看更多 →
Hudi表分区设计规范

议使用。建议事实表采用日期分区表，维度表采用非分区或者大颗粒度的日期分区是否采用分区表要根据表的总数据量、增量和使用方式来决定。从表的使用属性看事实表和维度表具有的特点：事实表：数据总量大，增量大，数据读取多以日期做切分，读取一定时间段的数据。维度表：总量相对小，增量小

来自：帮助中心

查看更多 →
Hudi表模型设计规范

流式计算采用MOR表。流式计算为低时延的实时计算，需要高性能的流式读写能力，在Hudi表中存在的MOR和COW两种模型中，MOR表的流式读写性能相对较好，因此在流式计算场景下采用MOR表模型。关于MOR表在读写性能的对比关系如下：对比维度 MOR表 COW表流式写高低流式读

来自：帮助中心

查看更多 →
设计规范

设计规范命名规范数据库对象（库名、表名、字段名、索引名）命名建议全部使用小写字母开头，后面跟字母或者数字，数据库对象（库名、表名、字段名、索引名）名字长度建议都不要大于32字节。数据库名称不能使用特殊字符("",.,$,\,/,*,?,~,#,:,|")和空字符\0，数据库

来自：帮助中心

查看更多 →
Hudi表索引设计规范

Hudi表索引设计规范规则禁止修改表索引类型。 Hudi表的索引会决定数据存储方式，随意修改索引类型会导致表中已有的存量数据与新增数据之间出现数据重复和数据准确性问题。常见的索引类型如下：布隆索引：Spark引擎独有索引，采用bloomfiter机制，将布隆索引内容写入到Parquet文件的footer中。

来自：帮助中心

查看更多 →
设计规范

设计规范命名规范数据库对象（库名、表名、字段名、索引名）命名建议全部使用小写字母开头，后面跟字母或者数字，数据库对象（库名、表名、字段名、索引名）名字长度建议都不要大于32字节。数据库名称不能使用特殊字符("",.,$,\,/,*,?,~,#,:,|")和空字符\0，数据库

来自：帮助中心

查看更多 →
基本设计规范

规则4：设计分区键以均匀分发工作负载，避免出现数据倾斜问题。表的主键的分区键部分确定存储表数据的逻辑分区，如果分区键分布不均衡，会导致节点与节点之间数据和负载不均衡，从而出现数据倾斜的问题。如表1为一些常见分区键分布均匀性的效果对比。表1 常见分区键分布均匀效果分区键值分区键分布均匀性

来自：帮助中心

查看更多 →
Hudi数据表设计规范

Hudi数据表设计规范 Hudi表模型设计规范 Hudi表索引设计规范 Hudi表分区设计规范父主题： Hudi应用开发规范

来自：帮助中心

查看更多 →
索引设计规范

索引列为表的一列或多列计算而来的一个函数或者标量表达式限制使用对于HASH分布表，主键和唯一索引必须包含分布键。当设计组合索引时，优化器会通过计算代价来选择合适的执行计划。例如：在组合索引(a,b,c)下，当查询时如果只使用过滤条件b，优化器经过计算索引成本较低时，会选择索引。

来自：帮助中心

查看更多 →
权限设计规范

允许使用指定的函数，以及利用这些函数实现的操作符。表空间 TABLESPACE CREATE 允许在表空间中创建表，允许在创建数据库和模式的时候把该表空间指定为缺省表空间。表 TABLE INSERT，DELETE UPDATE，SELECT 允许用户对指定表进行增删改查操作。 TRUNCATE

来自：帮助中心

查看更多 →
索引设计规范

index：表示使用索引，如果只有 Using index，说明没有查询到数据表，只用索引表即完成了这个查询，这种情况为覆盖索引。如果同时出现Using where，代表使用索引来查找读取记录，也是可以用到索引的，但是需要查询到数据表。 Using where：表示条件查询，如

来自：帮助中心

查看更多 →
数据仓库

数据仓库华为云数据仓库高级工程师培训父主题：培训服务

来自：帮助中心

查看更多 →
数据仓库

数据仓库表1 数据仓库权限权限对应API接口授权项（Action） IAM项目 (Project) 企业项目 (Enterprise Project) 获取数据仓库列表 GET /v1.0/{project_id}/common/warehouses octopus:dataWarehouse:list

来自：帮助中心

查看更多 →
数据仓库

数据仓库获取数据仓库列表信息获取数据仓库的数据列表父主题： API

来自：帮助中心

查看更多 →
获取数据仓库列表信息

获取数据仓库列表信息功能介绍获取数据仓库列表 URI GET /v1.0/{project_id}/common/warehouses 表1 路径参数参数是否必选参数类型描述 project_id 是 String 项目id，获取方法请参见获取项目ID 表2 Query参数

来自：帮助中心

查看更多 →
Spark DAG设计规范说明

车牌号1，[（通过时间，收费站3），（通过时间，收费站2），（通过时间，收费站4），（通过时间，收费站5）] 根据同行车要通过的收费站数量（例子里为3）分段该车通过的收费站序列，如上面的数据被分解成：收费站3->收费站2->收费站4，（车牌号1，[收费站3时间，收费站2时间，收费站4时间]）

来自：帮助中心

查看更多 →
数据库设计规范

数据库目前不支持不区分大小写的排序方式。目前仅支持对数据库定义字符集，不支持对表、字段等其他对象定义字符集。业务使用前必须先创建业务数据库。不应使用数据库安装后默认创建的postgres数据库存储业务数据。创建数据库时必须指定字符集为UTF8，创建数据库时必须选择与客户端统一的编码字符集。为了使用

来自：帮助中心

查看更多 →
字段设计规范

NULL字段，优化器在某些场景下会进行特殊优化，可较大提升查询性能。不建议对表预留字段。大部分场景下可支持快速新增、删除表字段，或者修改字段的DEFAULT值。新增列必须符合以下要求，否则会带来全表更新开销，影响在线业务。数据类型为以下类型中的一种：BOOL, BYTEA,

来自：帮助中心

查看更多 →
阅读指引

，引导您完成创建数据仓库集群、创建数据库表、上传数据和测试查询这一过程。如果打算或正在将应用程序从其他数据仓库向 GaussDB (DWS)迁移，您可能想知道GaussDB(DWS)在实施方式上有什么区别。 GaussDB(DWS)进行数据库应用程序开发过程中，下表将帮您找到对应的信息。

来自：帮助中心

查看更多 →
阅读指引

，引导您完成创建数据仓库集群、创建数据库表、上传数据和测试查询这一过程。如果计划或正在将应用程序从其他数据仓库向GaussDB(DWS)迁移，您可能想了解GaussDB(DWS)在实施方式上有什么区别。 GaussDB(DWS)进行数据库应用程序开发过程中，下表将帮您找到对应的信息。

来自：帮助中心

查看更多 →