数据仓库中事实表的设计_数据建模-华为云

GaussDB(DWS)是一款具备分析及混合负载能力的分布式数据库，支持x86和Kunpeng硬件架构，支持行存储与列存储，提供GB~PB级数据分析能力、多模分析和实时处理能力，用于数据仓库、数据集市、实时分析、实时决策和混合负载等场景，广泛应用于汽车、制造、零售、物流、互联网、金融、政府、电信等行业分析决策系统

华为云11.11 2核1G 2M 云服务器

29元/年

立即注册领万元上云礼券

抽奖赢11111元免单

续费同价 L实例 2核2G 4M

98元/年

热门域名 1元随心购

1元/年

免费体验中心

90+款云产品，最长可无限期免费试用

个人用户企业用户

免费

Flexus应用服务器L实例

即开即用，轻松运维，简单上云

新用户专享限购1台

¥0.00

云数据库免费试用

金融核心交易系统、政企OA办公等场景适用

注册申请

¥0.00

域名注册服务Domains

.com .cn多款热门域名首注1元起

新用户专享限购1个

￥1.00

华为云企业邮箱免费试用

即开即用，不限账号数

无限邮箱容量 4GB超大附件

¥0.00

免费试用

会打字就会建站

3300+模板，30000+企业选择

买2年送1年

¥368.00

跨境电商建站

10分钟快速建站，低成本开启跨境生意

试用14天跨境电商

￥0.00

/次

好会计，免费试用

全场景智能报销

免费体验15天

¥0.00

元/年

零代码构建平台

创建nocosys平台客户账号

智能协作企业办公

¥0.00

元/次

数据仓库中事实表的设计更多内容

数据建模

在设计模式中，可以通过图形化拖拉拽方式，按照数仓规划，配置维度模型和事实模型之间的关联关系，以便于数据开发人员在数据开发过程中，能够准确的理解各模型之间的关系并高效准确的设计 ETL 任务。图9 可视化设计逆向工程支持通过数据库导入的方式，快速将外部数据库中的表逆向为逻辑模型，导入到 DataFacts平台中，帮助用户在数据同步、ETL

来自：帮助中心

查看更多 →
表设计最佳实践

增强可用性：如果分区表的某个分区出现故障，表在其他分区的数据仍然可用。方便维护：如果分区表的某个分区出现故障，需要修复数据，只修复该分区即可。 GaussDB数据库支持的分区表为一级分区表和二级分区表，其中一级分区表包括范围分区表、间隔分区表、列表分区表、哈希分区表四种，二级分区表包括范围

来自：帮助中心

查看更多 →
表设计最佳实践

表设计最佳实践使用分区表分区表是把逻辑上的一张表根据某种方案分成几张物理块进行存储。这张逻辑上的表称之为分区表，物理块称之为分区。分区表是一张逻辑表，不存储数据，数据实际是存储在分区上的。分区表和普通表相比具有以下优点：改善查询性能：对分区对象的查询可以仅搜索自己关心的分区，提高检索效率。

来自：帮助中心

查看更多 →
表设计最佳实践

表设计最佳实践选择存储模型选择分布方式选择分布列使用分区表选择数据类型查看表所在节点父主题：最佳实践

来自：帮助中心

查看更多 →
表设计最佳实践

表设计最佳实践选择存储模型使用分区表选择数据类型父主题：最佳实践

来自：帮助中心

查看更多 →
获取数据仓库的数据列表

获取数据仓库的数据列表功能介绍获取数据仓库的数据列表 URI POST /v1.0/{project_id}/common/warehouses/{data_warehouse_id}/data 表1 路径参数参数是否必选参数类型描述 project_id 是 String

来自：帮助中心

查看更多 →
数据仓库

数据仓库表1 数据仓库权限权限对应API接口授权项（Action） IAM项目 (Project) 企业项目 (Enterprise Project) 获取数据仓库列表 GET /v1.0/{project_id}/common/warehouses octopus:dataWarehouse:list

来自：帮助中心

查看更多 →
数据仓库

数据仓库获取数据仓库列表信息获取数据仓库的数据列表父主题： API

来自：帮助中心

查看更多 →
表设计最佳实践

表设计最佳实践选择存储模型选择分布方式选择分布列使用局部聚簇使用分区表选择数据类型查看表所在节点父主题：最佳实践

来自：帮助中心

查看更多 →
表设计最佳实践

表设计最佳实践选择存储模型使用局部聚簇使用分区表选择数据类型父主题：最佳实践

来自：帮助中心

查看更多 →
获取数据仓库列表信息

获取数据仓库列表信息功能介绍获取数据仓库列表 URI GET /v1.0/{project_id}/common/warehouses 表1 路径参数参数是否必选参数类型描述 project_id 是 String 项目id，获取方法请参见获取项目ID 表2 Query参数

来自：帮助中心

查看更多 →
GaussDB(DWS)表设计规则

化，提高集群的性能和可支持的并发度。通过对关联条件和分组条件的仔细设计，能够尽可能的减少不必要的数据shuffle。选择存储方案【建议】表的存储类型是表定义设计的第一步，用户业务类型是决定表的存储类型的主要因素，表存储类型的选择依据请参考表1。表1 表的存储类型及场景存储模型

来自：帮助中心

查看更多 →
ClickHouse宽表设计

ClickHouse宽表设计 ClickHouse宽表设计原则 ClickHouse表字段设计 ClickHouse本地表设计 ClickHouse分布式表设计 ClickHouse分区设计 ClickHouse索引设计父主题： ClickHouse数据库设计

来自：帮助中心

查看更多 →
如何设计宽表主键

如何设计宽表主键 GeminiDB Cassandra是一款分布式数据引擎，宽表引擎中的数据均按照主键进行分布。在执行查询时，如果表中存在多列主键，系统会从最左边的主键开始匹配。如果主键设置不当，则可能导致主键无法被有效利用，进而产生热点问题，影响查询性能。因此，在数据分区和数据

来自：帮助中心

查看更多 →
基本概念

、季度、月度等级别的内容)。原子指标原子指标中的度量和属性来源于多维模型中的维度表和事实表，与多维模型所属的业务对象保持一致，与多维模型中的最细数据粒度保持一致。原子指标中仅含有唯一度量，所含其它所有与该度量、该业务对象相关的属性，旨在用于支撑衍生指标的敏捷自助消费。如：零售

来自：帮助中心

查看更多 →
GaussDB(DWS)表设计规则

化，提高集群的性能和可支持的并发度。通过对关联条件和分组条件的仔细设计，能够尽可能的减少不必要的数据shuffle。选择存储方案【建议】表的存储类型是表定义设计的第一步，用户业务类型是决定表的存储类型的主要因素，表存储类型的选择依据请参考表1。表1 表的存储类型及场景存储类型

来自：帮助中心

查看更多 →
数据仓库规格

0）云盘规格，该规格弹性伸缩，无限算力、无限容量，规格详情请参见表1。标准数仓（DWS 2.0）本地盘规格，该规格存储容量固定，不能够进行磁盘扩容，只能进行节点扩容，规格详情请参见表2。步长指在集群变配过程中增大或减小磁盘大小的间隔大小。用户在操作时需要按照对应规格的存储步长来选择。表1 标准数仓（DWS 2.0）云盘规格

来自：帮助中心

查看更多 →
数据仓库类型

备注1：存算分离表数据存储在OBS上，无需重分布，但是元数据和索引存储在本地，仍然需要进行重分布。存算分离表在重分布时，表只支持读，元数据的重分布时间一般比较短，但是，如果表上创建了索引，索引会影响重分布的性能，重分布完成时间与索引的数据量成正比关系，在此期间，表只支持读。实时

来自：帮助中心

查看更多 →
示例场景说明

本入门指导将参考如表1所示的流程，实现示例场景的数据治理。表1 DataArts Studio 数据治理流程主流程说明子任务操作指导步骤1：流程设计在使用DataArts Studio前，您需要进行业务调研和需求分析设计。需求分析、业务调研与业务流程设计需求分析业务调研

来自：帮助中心

查看更多 →
调优前：学习表结构设计

数据的冗余。一般情况下只有较小的维度表才会定义为Replication表。哈希表（Hash）表数据通过hash方式散列到集群中的所有DN实例上。数据量较大的事实表。在读/写数据时可以利用各个节点的IO资源，大大提升表的读/写速度。一般情况下大表（1000000条记录以上）定义为Hash表。

来自：帮助中心

查看更多 →
数据架构操作列表

数据架构操作列表云审计服务（Cloud Trace Service，简称 CTS ）为用户提供了云账户下资源的操作记录，可以帮您记录相关的操作事件，便于日后的查询、审计和回溯。表1 支持云审计的关键操作列表操作名称资源类型资源名称事件名称查看主题设计 DAYU_DS dsSubject

来自：帮助中心

查看更多 →