哈希分区

哈希分区（Hash Partition）是依据GaussDB内置的哈希算法，对分区键进行运算，从而实现数据到各分区的映射。在分区键取值范围不倾斜（no data skew）的场景下，哈希算法哈希算法能够让数据行在各个分区之间均匀分布，进而使得各分区的大小大致保持一致，是实现分区间数据均匀分布的理想方法。

哈希分区也是范围分区的一种易于使用的替代方法，特别是当待分区的数据并非历史数据，或者没有明显可用于分区的分区键时。示例如下：

gaussdb=# CREATE TABLE bmsql_order_line (
    ol_w_id          INTEGER   NOT NULL,
    ol_d_id          INTEGER   NOT NULL,
    ol_o_id          INTEGER   NOT NULL,
    ol_number        INTEGER   NOT NULL,
    ol_i_id          INTEGER   NOT NULL,
    ol_delivery_d    TIMESTAMP,
    ol_amount        DECIMAL(6,2),
    ol_supply_w_id   INTEGER,
    ol_quantity      INTEGER,
    ol_dist_info     CHAR(24)
)
--预先定义100个分区。
PARTITION BY HASH(ol_d_id)
(
    PARTITION p0,
    PARTITION p1,
    PARTITION p2,
    …
    PARTITION p99
);
--删除表。
gaussdb=# DROP TABLE bmsql_order_line;

上述例子中，使用bmsql_order_line表的ol_d_id列作为依据进行了分区，ol_d_id列是identifier性质的属性列，其本身既不具备时间维度的特征，也无法在某一特定维度上对数据做出区分。在这种情况下，采用哈希分区策略来对该表进行分表处理无疑是一个相当理想的选择。

相比其他分区类型，哈希分区除了需要提前确认分区键不存在严重的数据倾斜问题（即某一个或某几个值出现极高的重复频率）之外，用户仅需指定分区键以及分区数量，便能够完成分区的创建工作。而且，哈希分区能够切实保证每个分区内的数据实现均匀分布，在很大程度上提升了分区表的易用性。

父主题： 分区策略

上一篇：范围分区

下一篇：列表分区

意见反馈

文档内容是否对您有帮助？

有帮助没帮助

提供反馈

提交成功！非常感谢您的反馈，我们会继续努力做到更好！您可在我的云声建议查看反馈及问题处理状态。

系统繁忙，请稍后重试

在使用文档中是否遇到以下问题

内容与产品页面不一致

内容不易理解

缺失示例代码

步骤不可操作

搜不到想要的内容

缺少最佳实践

意见反馈（选填）

0/500

请至少选择一项反馈信息并填写问题反馈

字符长度不能超过500

直接提交取消

如您有其它疑问，您也可以通过华为云社区问答频道来与我们联系探讨

盘古Doer提问云社区提问

哈希分区

相关文档

意见反馈

文档内容是否对您有帮助？