更新时间:2026-02-06 GMT+08:00
分享

CREATE TABLE PARTITION AS

功能描述

根据查询结果创建分区表。

CREATE TABLE PARTITION AS创建一个分区表并且用来自SELECT命令的结果填充该分区表,数据将会按照指定的分区策略进行分区。该表的字段和SELECT输出字段的名称及数据类型相关。用户可以通过指定字段名称列表对SELECT输出字段的名称进行覆盖替换。

语法格式

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
CREATE  TABLE [ IF NOT EXISTS ] partition_table_name
    [ (column_name [, ...] ) ]
    [ { ENGINE [ = ] { InnoDB | 'InnoDB' | "InnoDB" } } [ [ , ] ... ] ]
    [ WITH ( {storage_parameter = value} [, ... ] ) ]
    [ ILM ADD POLICY ROW STORE COMPRESS ADVANCED ROW AFTER n { day | month | year } OF NO MODIFICATION [ ON ( EXPR )]]
    [ TABLESPACE tablespace_name ]
    [ DISTRIBUTE BY { REPLICATION | { [HASH ] ( column_name ) } } ]
    [ TO { GROUP groupname | NODE ( nodename [, ... ] ) } ]
    PARTITION BY partition_clause partition_definition_list
    AS query
    [ WITH [ NO ] DATA ];

各个字段详细信息请参见语法格式

参数说明

  • IF NOT EXISTS

    判断是否存在相同名称的依赖关系relation。

    如果指定IF NOT EXISTS关键字,创建表前会在当前Schema中查找是否已有名字相同的relation,若存在同名的relation,则不会新建并返回NOTICE提示。未指定IF NOT EXISTS关键字时,若Schema中存在同名relation,返回ERROR告警。

  • partition_table_name

    要创建的分区表名。

    取值范围:字符串,要符合标识符命名规范

  • column_name

    可选。新表中要创建的字段名。如果没有指定字段名,那么新表的字段名和SELECT语句输入的字段名一致。

    取值范围:字符串,要符合标识符命名规范

  • ENGINE

    MYSQL模式下支持,仅语法适配,且只支持设置InnoDB,无实际效果。

  • WITH ( storage_parameter [= value] [, ... ] )

    为表或索引指定一个可选的存储参数。参数的详细说明如下所示:

    • FILLFACTOR

      表的填充因子(fillfactor),一个介于10和100之间的百分数。未指定时默认值为100(完全填充)。在Ustore存储引擎下,该值的默认值为92。如果指定了较小的填充因子,INSERT操作仅按照填充因子指定的百分率填充表页,每个页上的剩余空间将用于在该页上更新行。较小的填充因子对于UPDATE操作,可以在同一页上有机会放置同一条记录的新版本,相较于将新版本的数据放置在其他页上更为有效。对于一个从不更新的表,建议将填充因子设为100,对于频繁更新的表,建议选择较小的填充因子。该参数仅对行存表有效。

      取值范围:10~100

    • ORIENTATION

      取值范围:ROW,表的数据将以行式存储。

      默认值:ROW

    • autovacuum_enabled

      表示是否开启表的自动清理功能。

      取值范围:on/off

      默认值:on

    • autovacuum_vacuum_threshold

      开启自动清理功能时,指定在该表中触发VACUUM所需的更新或删除的最小元组数(仅对Astore表生效)。

      取值范围:0~2147483647

      默认值:未指定时与GUC参数autovacuum_vacuum_threshold一致。

    • autovacuum_analyze_threshold

      开启自动清理功能时,指定在该表中触发ANALYZE所需的插入、更新或删除的最小元组数。

      取值范围:0~2147483647

      默认值:未指定时与GUC参数autovacuum_analyze_threshold一致。

    • autovacuum_vacuum_scale_factor

      开启自动清理功能时,指定在该表中触发VACUUM所需的插入、更新或删除元组的比例(仅对Astore表生效)。

      取值范围:0.0~100.0

      默认值:未指定时与GUC参数autovacuum_vacuum_scale_factor一致。

    • autovacuum_analyze_scale_factor

      开启自动清理功能时,指定在该表中触发ANALYZE所需的插入、更新或删除元组的比例。

      取值范围:0.0~100.0

      默认值:未指定时与GUC参数autovacuum_analyze_scale_factor一致。

    • autovacuum_freeze_min_age

      开启自动清理功能时,在该表参数指定了一个行版本的最小范围,超过这个范围的行会被冻结。

      取值范围:0~576460752303423487

      默认值:未指定时与GUC参数vacuum_freeze_min_age一致。

    • autovacuum_freeze_max_age

      开启自动清理功能时,该表pg_class.relfrozenxid字段在超过指定个事务后,就会强制执行VACUUM操作,即使自动清理被禁用,系统也会启动AUTOVACUUM进程。清理操作还允许从pg_clog/子目录中删除旧文件(仅对Astore表生效)。

      取值范围:100000~576460752303423487

      默认值:未指定时与GUC参数autovacuum_freeze_max_age一致。

    • autovacuum_freeze_table_age

      开启自动清理功能时,该表被标记为不需要自动清理时,将保持不变的时间(仅对Astore表生效)。

      取值范围:0~576460752303423487

      默认值:未指定时与GUC参数vacuum_freeze_table_age一致。

    • hashbucket

      创建hash bucket存储。本参数仅支持行存表和行存Range表。

      取值范围:on/off

      默认值:off

      当前版本hashbucket表相关DDL操作性能受限,不建议频繁对hashbucket表进行DDL操作。

  • [ ILM ADD POLICY ROW STORE COMPRESS ADVANCED ROW AFTER n { day | month | year } OF NO MODIFICATION [ ON ( EXPR )]]

    创建新表时,可以调用ILM ADD POLICY ROW STORE COMPRESS ADVANCED ROW为行存添加高级压缩策略。

    • AFTER n { day | month | year } OF NO MODIFICATION:表示n天/月/年没有修改的行。
    • ON ( EXPR ):行级表达式,用于判断行的冷热。

      在ILM策略的ON ( EXPR )行级表达式支持的函数中,部分函数的输出可能会受兼容性参数影响。例如,upper函数在MYSQL兼容模式下设置b_format_version='5.7'和b_format_dev_version='s2'后,将无法转大写。

  • TABLESPACE tablespace_name

    创建新表时指定此关键字,表示新表将要在指定的表空间tablespace_name内创建。如果没有声明,将使用默认表空间。

  • DISTRIBUTE BY

    详细信息请参见DISTRIBUTE BY

  • TO { GROUP groupname | NODE ( nodename [, ... ] ) }

    指定创建表所在的Node Group。

    该语法仅供内部扩容工具使用,不建议用户直接使用。

  • PARTITION BY

    partition_clause与partition_definition_list的各字段详细信息请参见参数说明

  • AS query

    一个SELECT VALUES命令或者一个运行预备好的SELECT或VALUES查询的EXECUTE命令。

  • [ WITH [ NO ] DATA ]

    创建分区表时,是否将查询到的数据进行插入。默认插入,当指定NO时,则表示不插入数据。

示例

创建一级分区表,并使用子查询数据填充分区表。
-- 创建一个源表t1,并插入3条数据。
gaussdb=# CREATE TABLE t1(a int, b int) DISTRIBUTE BY HASH(a);
gaussdb=# INSERT INTO t1 VALUES(8, 2);
gaussdb=# INSERT INTO t1 VALUES(18, 3);
gaussdb=# INSERT INTO t1 VALUES(28, 4);

-- 使用CREATE TABLE PARTITION AS创建一级分区表,并使用子查询数据填充分区表
gaussdb=# CREATE TABLE t1_part_dup DISTRIBUTE BY HASH(a) PARTITION BY RANGE(a)
(
    PARTITION p1 VALUES LESS THAN(10),
    PARTITION p2 VALUES LESS THAN(20),
    PARTITION p3 VALUES LESS THAN(MAXVALUE)
) AS SELECT * FROM t1;
gaussdb=# \d+ t1_part_dup;
          Table "create_table_as_partition_by.t1_part_dup"
 Column |  Type   | Modifiers | Storage | Stats target | Description 
--------+---------+-----------+---------+--------------+-------------
 a      | integer |           | plain   |              | 
 b      | integer |           | plain   |              | 
Partition By RANGE(a)
Number of partitions: 3 (View pg_partition to check each partition range.)
Has OIDs: no
Distribute By: HASH(a)
Location Nodes: ALL DATANODES
Options: orientation=row, compression=no

gaussdb=# SELECT a, b FROM t1_part_dup PARTITION(p1) ORDER BY a;
 a | b 
---+---
 8 | 2
(1 row)

gaussdb=# SELECT a, b FROM t1_part_dup PARTITION(p2) ORDER BY a;
 a  | b 
----+---
 18 | 3
(1 row)

gaussdb=# SELECT a, b FROM t1_part_dup PARTITION(p3) ORDER BY a;
 a  | b 
----+---
 28 | 4
(1 row)
gaussdb=# DROP TABLE t1, t1_part_dup;

相关文档