数据仓库设计拉链表的步骤

GaussDB(DWS)是一款具备分析及混合负载能力的分布式数据库，支持x86和Kunpeng硬件架构，支持行存储与列存储，提供GB~PB级数据分析能力、多模分析和实时处理能力，用于数据仓库、数据集市、实时分析、实时决策和混合负载等场景，广泛应用于汽车、制造、零售、物流、互联网、金融、政府、电信等行业分析决策系统

普惠上云 2核2G2M云服务器

38元/年

云服务器秒杀 X实例-4核8G5M

338元/年

Flexus L实例 2核2G3M云服务器

68元/年

网站搭建买3年送2年

1元/天

免费体验中心

90+款云产品，最长可无限期免费试用

个人用户企业用户

免费

Flexus应用服务器L实例

即开即用，轻松运维，简单上云

新用户专享限购1台

¥0.00

云数据库免费试用

金融核心交易系统、政企OA办公等场景适用

注册申请

¥0.00

域名注册服务Domains

.com .cn多款热门域名首注1元起

新用户专享限购1个

￥1.00

华为云企业邮箱免费试用

即开即用，不限账号数

无限邮箱容量 4GB超大附件

¥0.00

免费试用

会打字就会建站

3300+模板，30000+企业选择

买2年送1年

¥368.00

跨境电商建站

10分钟快速建站，低成本开启跨境生意

试用14天跨境电商

￥0.00

/次

好会计，免费试用

全场景智能报销

免费体验15天

¥0.00

元/年

零代码构建平台

创建nocosys平台客户账号

智能协作企业办公

¥0.00

元/次

数据仓库设计拉链表的步骤更多内容

数据仓库

数据仓库表1 数据仓库权限权限对应API接口授权项（Action） IAM项目 (Project) 企业项目 (Enterprise Project) 获取数据仓库列表 GET /v1.0/{project_id}/common/warehouses octopus:dataWarehouse:list

来自：帮助中心

查看更多 →
数据仓库

数据仓库获取数据仓库列表信息获取数据仓库的数据列表父主题： API

来自：帮助中心

查看更多 →
维度建模

数据应用系统的需求，再提炼数据集市的数据接口需求目标表设计：即数据集市结果表设计，根据数据应用的需求进行数据表设计数据源分析：主要分析数据仓库的数据如何满足集市的需要，即确定需要数据仓库的那些表数据，如果数据仓库没有，则需要数据仓库进行数据补充数据仓库表与目标表字段进行映射，确定加工规则

来自：帮助中心

查看更多 →
获取数据仓库列表信息

获取数据仓库列表信息功能介绍获取数据仓库列表 URI GET /v1.0/{project_id}/common/warehouses 表1 路径参数参数是否必选参数类型描述 project_id 是 String 项目id，获取方法请参见获取项目ID 表2 Query参数

来自：帮助中心

查看更多 →
库表设计规范

避免使用分区表，如有需要，可以使用多个独立的表代替。分区表的缺点： DDL操作需要锁定所有分区，导致所有分区上操作都被阻塞。当表数据量较大时，对分区表进行DDL或其他运维操作难度大风险高。分区表使用较少，存在未知风险。当单台服务器性能无法满足时，对分区表进行分拆的成本较高。

来自：帮助中心

查看更多 →
表结构设计

：选择表存储方式、压缩级别、分布方式、分布列以及使用分区表和局部聚簇等，从而实现表性能的优化。选择存储方式表的存储模型选择是表定义的第一步。业务属性是表的存储模型的决定性因素，根据下表选择适合当前业务的存储模型。一般情况下，如果表的字段比较多（大宽表），查询中涉及到的列不多

来自：帮助中心

查看更多 →
数据仓库规格

情请参见表1。标准数仓（DWS 2.0）本地盘规格，该规格存储容量固定，不能够进行磁盘扩容，只能进行节点扩容，规格详情请参见表2。步长指在集群变配过程中增大或减小磁盘大小的间隔大小。用户在操作时需要按照对应规格的存储步长来选择。表1 标准数仓（DWS 2.0）云盘规格规格名称

来自：帮助中心

查看更多 →
数据仓库类型

IoT数仓：在标准数仓基础上，提供高效的时序计算和IoT分析能力，支持实时和历史数据关联，内置时序算子，最高40x压缩。适用于物联网IoT等实时分析场景。 GaussDB (DWS)数仓之间暂不支持互相访问，用户可通过创建的OBS外表，将两个数据库关联在同一个数据目录下进行数据查询。功能特性对比表1 功能特性对比

来自：帮助中心

查看更多 →
阅读指引

进行建模，能够更好的契合GaussDB(DWS)的分布式处理架构，输出更高效的业务SQL代码。对业务的执行效率不满意，期望通过调优加快业务执行的情况下，可以参考优化查询性能进行调优。性能调优是一项复杂的工程，有些时候无法系统性地说明和解释，而是依赖于DBA的经验判断。尽管如此，

来自：帮助中心

查看更多 →
阅读指引

进行建模，能够更好的契合GaussDB(DWS)的分布式处理架构，输出更高效的业务SQL代码。对业务的执行效率不满意，期望通过调优加快业务执行的情况下，可以参考优化查询性能进行调优。性能调优是一项复杂的工程，有些时候无法系统性地说明和解释，而是依赖于DBA的经验判断。尽管如此，

来自：帮助中心

查看更多 →
步骤四：修改VPC的路由表

步骤四：修改VPC的路由表本节指导您通过修改防护VPC的路由表将路由指向企业路由器。至少需要修改两个VPC的路由表，每增加一个防护的VPC，都需为该VPC增加一条路由。操作步骤在左侧导航栏中，选择“网络 > 虚拟私有云 > 路由表”，进入“路由表”页面。在“名称/ID”

来自：帮助中心

查看更多 →
Hudi表模型设计规范

流式计算采用MOR表。流式计算为低时延的实时计算，需要高性能的流式读写能力，在Hudi表中存在的MOR和COW两种模型中，MOR表的流式读写性能相对较好，因此在流式计算场景下采用MOR表模型。关于MOR表在读写性能的对比关系如下：对比维度 MOR表 COW表流式写高低流式读

来自：帮助中心

查看更多 →
ClickHouse宽表设计原则

ClickHouse宽表设计原则宽表设计原则由于ClickHouse的宽表查询性能较优，且当前ClickHouse可支持上万列的宽表横向扩展。在大部分场景下，有大表两表join以及多表join的场景，且多个join的表数据变化更新频率较低，这种情况，建议对多个表join查询逻辑提

来自：帮助中心

查看更多 →
Hudi表分区设计规范

当指定Hudi的索引类型为Global索引类型时，Hudi支持跨分区进行数据更新，但Global索引性能较差一般不建议使用。建议事实表采用日期分区表，维度表采用非分区或者大颗粒度的日期分区是否采用分区表要根据表的总数据量、增量和使用方式来决定。从表的使用属性看事实表和维度表具有的特点：

来自：帮助中心

查看更多 →
视图和关联表设计

视图和关联表设计视图设计除非视图之间存在强依赖关系，否则不建议视图嵌套。视图定义中尽量避免排序操作。关联表设计表之间的关联字段应该尽量少。关联字段的数据类型应该保持一致。关联字段在命名上，应该可以明显体现出关联关系。例如，采用同样名称来命名。父主题：数据库对象设计

来自：帮助中心

查看更多 →
视图和关联表设计

视图和关联表设计视图设计除非视图之间存在强依赖关系，否则不建议视图嵌套。视图定义中尽量避免排序操作。关联表设计表之间的关联字段应该尽量少。关联字段的数据类型应该保持一致。关联字段在命名上，应该可以明显体现出关联关系。例如，采用同样名称来命名。父主题：数据库对象设计

来自：帮助中心

查看更多 →
视图和关联表设计

视图和关联表设计视图设计【建议】除非视图之间存在强依赖关系，否则不建议视图嵌套。【建议】视图定义中尽量避免排序操作。关联表设计【建议】表之间的关联字段应该尽量少。【建议】关联字段的数据类型应该保持一致。【建议】关联字段在命名上，应该可以明显体现出关联关系。例如，采用同样名称来命名。

来自：帮助中心

查看更多 →
Hudi表索引设计规范

能；同时由于Flink冷启动的时候需要遍历全表数据，大数据量也会导致Flink作业启动缓慢。因此基于简化使用的角度，针对大数据量的表，可以通过采用Bucket索引来避免状态后端的复杂调优。如果Bucket索引+分区表的模式无法平衡Bueckt桶过大的问题，还是可以继续采用Fli

来自：帮助中心

查看更多 →
ClickHouse本地表设计

ClickHouse本地表设计规则单表（分布式表）的记录数不要超过万亿，对于万亿以上表的查询，性能较差，且集群维护难度变大。单表（本地表）不超过百亿。表的设计都要考虑到数据的生命周期管理，需要进行TTL表属性设置或定期老化清理表分区数据。单表的字段建议不要超过5000列。

来自：帮助中心

查看更多 →
视图和关联表设计

视图和关联表设计视图设计除非视图之间存在强依赖关系，否则不建议视图嵌套。视图定义中尽量避免排序操作。关联表设计表之间的关联字段应该尽量少。关联字段的数据类型应该保持一致。关联字段在命名上，应该可以明显体现出关联关系。例如，采用同样名称来命名。父主题：数据库对象设计

来自：帮助中心

查看更多 →
视图和关联表设计

视图和关联表设计视图设计除非视图之间存在强依赖关系，否则不建议视图嵌套。视图定义中尽量避免排序操作。关联表设计表之间的关联字段应该尽量少。关联字段的数据类型应该保持一致。关联字段在命名上，应该可以明显体现出关联关系。例如，采用同样名称来命名。父主题：数据库对象设计

来自：帮助中心

查看更多 →