本文导读

展开导读

文档首页/ 数据仓库服务 GaussDB(DWS)/ 开发指南/ 标准数仓开发指南(9.1.0.x)/ GaussDB(DWS)性能调优/ SQL调优/ 审视和修改表定义

审视和修改表定义

更新时间：2024-12-06 GMT+08:00

查看PDF

在分布式框架下，数据分布在各个DN上。一个或者几个DN的数据存在一块物理存储设备上，较好的表定义需要满足以下要求：

表数据均匀分布在各个DN上，以防止单个DN对应的存储设备空间不足造成集群有效容量下降。选择合适分布列，避免数据分布倾斜可以实现该点。
表Scan压力均匀分散在各个DN上，以避免单DN的Scan压力过大，形成Scan的单节点瓶颈。分布列不选择基表上等值filter中的列可以实现该点。
减少扫描数据量。通过分区的剪枝机制可以实现该点。
尽量减少随机IO。通过聚簇/局部聚簇可以实现该点。
尽量避免数据shuffle，减小网络压力。通过选择join-condition或者group by列为分布列可以最大程度的实现这点。

从上述描述来看表定义中最重要的一点是分布列的选择。创建表定义一般遵循图1所示流程。表定义在数据库设计阶段创建，在SQL调优过程中进行审视和修改。

图1 表定义流程

点击放大

审视和修改表定义的具体操作方法，请参见基于表结构设计和调优提升GaussDB(DWS)查询性能。

父主题： SQL调优

上一篇：更新统计信息

下一篇：SQL调优进阶

相关文档

意见反馈

文档内容是否对您有帮助？

有帮助没帮助

提供反馈

提交成功！非常感谢您的反馈，我们会继续努力做到更好！您可在我的云声建议查看反馈及问题处理状态。

系统繁忙，请稍后重试

在使用文档中是否遇到以下问题

内容与产品页面不一致

内容不易理解

缺失示例代码

步骤不可操作

搜不到想要的内容

缺少最佳实践

意见反馈（选填）

0/500

请至少选择一项反馈信息并填写问题反馈

字符长度不能超过500

直接提交取消

如您有其它疑问，您也可以通过华为云社区问答频道来与我们联系探讨

智能客服提问云社区提问

下载华为云App

关注云资讯，随时随地管控云服务

文档反馈

文档反馈

意见反馈

0/500

标记内容

同时提交标记内容

登录并提交直接提交取消