文档首页/ 云数据库 GaussDB/ 开发指南（集中式_V2.0-3.x）/ SQL参考/ SQL语法/ CLUSTER

更新时间：2024-07-15 GMT+08:00

查看PDF

CLUSTER

功能描述

根据一个索引对表进行聚簇排序。
CLUSTER指定GaussDB通过索引名指定的索引聚簇由表名指定的表。表名上必须已经定义该索引。
当对一个表聚集后，该表将基于索引信息进行物理存储。聚集是一次性操作：当表被更新之后，更改的内容不会被聚集。也就是说，系统不会试图按照索引顺序对新的存储内容及更新记录进行重新聚集。
在对一个表聚簇之后，GaussDB会记录该表在哪个索引上建立了聚簇。CLUSTER table_name将在该表之前记录过的聚簇索引上重新聚簇。用户也可以用ALTER TABLE table_name CLUSTER on index_name来设置指定表用于后续聚簇操作的索引，或使用ALTER TABLE table_name SET WITHOUT CLUSTER来清除指定表之前设置的聚簇索引。
不含参数的CLUSTER命令会将当前用户所拥有的数据库中的先前做过聚簇的所有表重新处理，或者系统管理员调用的这些表。
在对一个表进行聚簇的时候，会在其上请求一个ACCESS EXCLUSIVE锁。这样就避免了在CLUSTER完成之前对此表执行其它的操作(包括读写)。

注意事项

只有行存B-tree索引支持CLUSTER操作。
如果用户只是随机访问表中的行，那么表中数据的实际存储顺序是无关紧要的。但是，如果对某些特定数据的访问次数较多，而且有一个索引将这些数据分组，那么使用CLUSTER索引对性能会有所提升。
如果一个请求从表中查找的索引是一个范围，或者是一个索引值对应多行，CLUSTER也会有助于应用，因为如果索引标识出了第一匹配行所在的存储页，所有其它行也可能也已经在同一个存储页里了，这样便节省了磁盘访问的时间，加速了查询。
在聚簇过程中，系统会先创建一个按照索引顺序建立的表的临时备份，同时也建立表上的每个索引的临时备份。因此，聚簇过程中需要保证磁盘上有足够的剩余空间，至少是表大小与全部索引大小之和。
因为CLUSTER记录着哪些索引曾被用于聚簇，所以用户可以在第一次手动指定索引，对指定表进行聚簇，然后设置一个周期化执行的维护脚本，只需执行不带参数的CLUSTER命令，就可以实现对想要周期性聚簇的表进行自动更新。
因为优化器记录着有关表的排序的统计，在表上执行聚簇操作后，需运行ANALYZE操作以确保优化器具备最新的排序信息，否则，优化器可能会选择非最优的查询规划。
CLUSTER不允许在事务中执行。
如果没有打开xc_maintenance_mode参数，那么CLUSTER操作将跳过所有系统表。

语法格式

对一个表进行聚簇排序。

CLUSTER [ VERBOSE ] table_name [ USING index_name ];

对一个分区进行聚簇排序。

CLUSTER [ VERBOSE ] table_name PARTITION ( partition_name ) [ USING index_name ];

对已做过聚簇的表重新进行聚簇。
```
CLUSTER [ VERBOSE ];
```

参数说明

VERBOSE
启用显示进度信息。
table_name
表名称。

取值范围：已存在的表名称。
index_name
索引名称。

取值范围：已存在的索引名称。
partition_name
分区名称。

取值范围：已存在的分区名称。

示例

--创建SCHEMA。
gaussdb=# CREATE SCHEMA tpcds;

--创建一个分区表。
gaussdb=# CREATE TABLE tpcds.inventory_p1
(
    INV_DATE_SK               INTEGER               NOT NULL,
    INV_ITEM_SK               INTEGER               NOT NULL,
    INV_WAREHOUSE_SK          INTEGER               NOT NULL,
    INV_QUANTITY_ON_HAND      INTEGER
)
PARTITION BY RANGE(INV_DATE_SK)
(
        PARTITION P1 VALUES LESS THAN(2451179),
        PARTITION P2 VALUES LESS THAN(2451544),
        PARTITION P3 VALUES LESS THAN(2451910),
        PARTITION P4 VALUES LESS THAN(2452275),
        PARTITION P5 VALUES LESS THAN(2452640),
        PARTITION P6 VALUES LESS THAN(2453005),
        PARTITION P7 VALUES LESS THAN(MAXVALUE)
);

--创建索引ds_inventory_p1_index1。
gaussdb=# CREATE INDEX ds_inventory_p1_index1 ON tpcds.inventory_p1 (INV_ITEM_SK) LOCAL;

--对表tpcds.inventory_p1进行聚集。
gaussdb=# CLUSTER tpcds.inventory_p1 USING ds_inventory_p1_index1;

--对分区p3进行聚集。
gaussdb=# CLUSTER tpcds.inventory_p1 PARTITION (p3) USING ds_inventory_p1_index1;

--对数据库中可以进行聚集的表进聚集。
gaussdb=# CLUSTER;

--删除索引。
gaussdb=# DROP INDEX tpcds.ds_inventory_p1_index1;

--删除分区表。
gaussdb=# DROP TABLE tpcds.inventory_p1;

--删除SCHEMA。
gaussdb=# DROP SCHEMA tpcds CASCADE;

优化建议

cluster
- 建议在新近聚簇的表上运行ANALYZE。否则，优化器可能会选择很差劲的查询规划。
- 不允许在事务中执行CLUSTER。

父主题： SQL语法

上一篇：CLOSE

下一篇：COMMENT

意见反馈

文档内容是否对您有帮助？

有帮助没帮助

提供反馈

提交成功！非常感谢您的反馈，我们会继续努力做到更好！您可在我的云声建议查看反馈及问题处理状态。

系统繁忙，请稍后重试

在使用文档中是否遇到以下问题

内容与产品页面不一致

内容不易理解

缺失示例代码

步骤不可操作

搜不到想要的内容

缺少最佳实践

意见反馈（选填）

0/500

请至少选择一项反馈信息并填写问题反馈

字符长度不能超过500

直接提交取消

如您有其它疑问，您也可以通过华为云社区问答频道来与我们联系探讨

智能客服提问云社区提问

CLUSTER

功能描述

注意事项

语法格式

参数说明

示例

优化建议

相关文档

意见反馈

文档内容是否对您有帮助？

7*24

备案

专业服务

退订

建议反馈

售前咨询热线