数据仓库中事实表的设计_事实表接口-华为云

GaussDB(DWS)是一款具备分析及混合负载能力的分布式数据库，支持x86和Kunpeng硬件架构，支持行存储与列存储，提供GB~PB级数据分析能力、多模分析和实时处理能力，用于数据仓库、数据集市、实时分析、实时决策和混合负载等场景，广泛应用于汽车、制造、零售、物流、互联网、金融、政府、电信等行业分析决策系统

新客秒杀 2核2G 3M L实例

68元/年

普惠上云领千元上云礼券

立即前往

企业专享 X实例 4核8G 5M

888元/年

热门域名 1元随心购

1元/年起

免费体验中心

90+款云产品，最长可无限期免费试用

个人用户企业用户

免费

Flexus应用服务器L实例

即开即用，轻松运维，简单上云

新用户专享限购1台

¥0.00

云数据库免费试用

金融核心交易系统、政企OA办公等场景适用

注册申请

¥0.00

域名注册服务Domains

.com .cn多款热门域名

新用户专享限购1个

立即前往

华为云企业邮箱免费试用

即开即用，不限账号数

无限邮箱容量 4GB超大附件

¥0.00

免费试用

会打字就会建站

3300+模板，30000+企业选择

立即购买

跨境电商建站

10分钟快速建站，低成本开启跨境生意

试用14天跨境电商

￥0.00

/次

好会计，免费试用

全场景智能报销

免费体验15天

¥0.00

元/年

零代码构建平台

创建nocosys平台客户账号

智能协作企业办公

¥0.00

元/次

数据仓库中事实表的设计更多内容

事实表接口

事实表接口查找事实表删除事实表查看事实表详情查看逆向事实表任务父主题：数据架构API

来自：帮助中心

查看更多 →
新建事实表

，不勾选则无法同步。管理事实表事实表创建好之后，进入数据架构的“维度建模 > 事实表”页面，您可以对事实表进行编辑、发布、下线、查看发布历史或删除操作。图5 事实表管理编辑事实表在事实表列表中，找到需要编辑的事实表，单击“编辑”，进入编辑事实表页面。根据实际需要编辑相关内容。

来自：帮助中心

查看更多 →
删除事实表

Array of strings ID列表，ID字符串。 del_types 否 String 删除类型。枚举值： PHYSICAL_TABLE: 是否删除数据库物理表，只针对能物化的表生效（配置此值则表示删除）响应参数状态码： 200 表4 响应Body参数参数参数类型描述

来自：帮助中心

查看更多 →
查看事实表详情

REPLICATION: 表的每一行存在所有数据节点（DN）中，即每个数据节点都有完整的表数据 distribute_column String DISTRIBUTE BY HASH column. table_type String 表类型。 status String 实体的发布状态，只读，创建和更新时无需填写。

来自：帮助中心

查看更多 →
维度建模

数据应用系统的需求，再提炼数据集市的数据接口需求目标表设计：即数据集市结果表设计，根据数据应用的需求进行数据表设计数据源分析：主要分析数据仓库的数据如何满足集市的需要，即确定需要数据仓库的那些表数据，如果数据仓库没有，则需要数据仓库进行数据补充数据仓库表与目标表字段进行映射，确定加工规则

来自：帮助中心

查看更多 →
查找事实表

REPLICATION: 表的每一行存在所有数据节点（DN）中，即每个数据节点都有完整的表数据 distribute_column String DISTRIBUTE BY HASH column. table_type String 表类型。 status String 实体的发布状态，只读，创建和更新时无需填写。

来自：帮助中心

查看更多 →
查看逆向事实表任务

描述 data data object data，统一的返回结果的最外层数据结构。表4 data 参数参数类型描述 value BatchOperationVO object value，统一的返回结果的外层数据结构。表5 BatchOperationVO 参数参数类型描述

来自：帮助中心

查看更多 →
表设计

表设计总体上讲，良好的表设计需要遵循以下原则：减少需要扫描的数据量。通过分区表的剪枝机制可以大幅减少数据的扫描量。尽量减少随机I/O。通过聚簇可以实现热数据的连续存储，将随机I/O转换为连续I/O，从而减少扫描的I/O代价。选择分区方案当表中的数据量很大时，应当对表进行分区，一般需要遵循以下原则：

来自：帮助中心

查看更多 →
表设计

表的分布方式及使用场景所示。表1 表的分布方式及使用场景分布方式描述适用场景 Hash 表数据通过Hash方式散列到集群中的所有DN上。数据量较大的事实表。 Replication 集群中每一个DN都有一份全量表数据。维度表、数据量较小的事实表。 Range 表数据对指定列按照范围进行映射，分布到对应DN。

来自：帮助中心

查看更多 →
表设计

表设计总体上讲，良好的表设计需要遵循以下原则：减少需要扫描的数据量。通过分区表的剪枝机制可以大幅减少数据的扫描量。尽量减少随机I/O。通过聚簇可以实现热数据的连续存储，将随机I/O转换为连续I/O，从而减少扫描的I/O代价。选择分区方案当表中的数据量很大时，应当对表进行分区，一般需要遵循以下原则：

来自：帮助中心

查看更多 →
数据架构支持哪些数据建模方法？

维度建模是从分析决策的需求出发构建模型，它主要是为分析需求服务，因此它重点关注用户如何更快速地完成需求分析，同时具有较好的大规模复杂查询的响应性能。多维模型是由数字型度量值组成的一张事实表连接到一组包含描述属性的多张维度表，事实表与维度表通过主/外键实现关联。典型的维度模型有星形模

来自：帮助中心

查看更多 →
表设计

联条件和分组条件的仔细设计，能够尽可能的减少不必要的数据shuffle。选择存储方案【建议】表的存储类型是表定义设计的第一步，客户业务类型是决定表的存储类型的主要因素，表存储类型的选择依据请参考表1。表1 表的存储类型及场景存储类型适用场景行存点查询(返回记录少，基于索引的简单查询)。

来自：帮助中心

查看更多 →
表设计

【建议】表的存储类型是表定义设计的第一步，客户业务类型是决定表的存储类型的主要因素，表存储类型的选择依据请参考表1。表1 表的存储类型及场景存储类型适用场景行存点查询（返回记录少，基于索引的简单查询）。增、删、改操作较多的场景。选择分区方案当表中的数据量很大时，应当对表进行分区，一般需要遵循以下原则：

来自：帮助中心

查看更多 →
表设计

用了大量宝贵的网络资源，减少不必要的数据shuffle，可以减少网络压力，使数据的处理本地化，以提高集群的性能和可支持的并发度。通过对关联条件和分组条件的仔细设计，能够尽可能的减少不必要的数据shuffle。选择分布方案表的分布方式的选择如表1所示。表1 表的分布方式及使用场景

来自：帮助中心

查看更多 →
账表设计

业务需要设置分析报表的分类，便于日后按分类查找报表。图3 账表分类在账表分类上新建报表，设置报表编码、名称等信息。图4 新建账表新建报表后报表是没有样式的，还需要针对新建的报表设计该报表的格式。设计格式之初，首先选择合适的数据模型，然后进行报表格式设计。图5 数据模型选择

来自：帮助中心

查看更多 →
数据架构概述

搜索”可以查找指定的表，单击“表名称”，可以进入表的详情页面，查看表的详细信息。新建单击“新建”，可以新建逻辑实体、物理表、维度、事实表和汇总表。创建的过程可以参见逻辑模型、关系建模、新建维度、新建事实表、数据集市。同步单击“更多 > 同步”，可以同步表到数据目录，作为技

来自：帮助中心

查看更多 →
表设计最佳实践

表设计最佳实践使用分区表选择数据类型父主题：最佳实践

来自：帮助中心

查看更多 →
表设计最佳实践

表设计最佳实践选择分布方式选择分布列使用分区表选择数据类型查看表所在节点父主题：最佳实践

来自：帮助中心

查看更多 →
表设计最佳实践

表设计最佳实践选择存储模型使用分区表选择数据类型父主题：最佳实践

来自：帮助中心

查看更多 →
表设计最佳实践

表设计最佳实践选择存储模型选择分布方式选择分布列使用分区表选择数据类型查看表所在节点父主题：最佳实践

来自：帮助中心

查看更多 →
获取数据仓库的数据列表

获取数据仓库的数据列表功能介绍获取数据仓库的数据列表 URI POST /v1.0/{project_id}/common/warehouses/{data_warehouse_id}/data 表1 路径参数参数是否必选参数类型描述 project_id 是 String

来自：帮助中心

查看更多 →