更新时间:2024-06-03 GMT+08:00

CREATE TABLE AS

功能描述

根据查询结果创建表。

CREATE TABLE AS创建一个表并且用来自SELECT命令的结果填充该表。该表的字段和SELECT输出字段的名称及数据类型相关。不过用户可以通过明确地给出一个字段名称列表来覆盖SELECT输出字段的名称。

CREATE TABLE AS和创建视图有些相似,CREATE TABLE AS会创建一个新表并且只计算该查询一次用来将数据写入新表中。这个表之后将不会根据源表变化而改变。相反视图只要被查询,它的定义SELECT语句将会被重新计算。

注意事项

  • 分区表不能采用此方式进行创建。
  • 如果在建表过程中数据库系统发生故障,系统恢复后可能无法自动清除之前已创建的、大小非0的磁盘文件。此种情况出现概率小,不影响数据库系统的正常运行。
  • 在为数据对象增加或者变更ILM策略的时候,如果追加了行级表达式,需要注意行表达式目前只支持白名单中列出的函数。具体白名单函数列表参考行表达式函数白名单

语法格式

CREATE [ [ GLOBAL | LOCAL ] [ TEMPORARY | TEMP ] | UNLOGGED ] TABLE [ IF NOT EXISTS ] table_name
    [ (column_name [, ...] ) ]
    [ { ENGINE [ = ] { InnoDB | 'InnoDB' | "InnoDB" } } [ [ , ] ... ] ]
    [ WITH ( {storage_parameter = value} [, ... ] ) ]
    [ ON COMMIT { PRESERVE ROWS | DELETE ROWS } ]
    [ ILM ADD POLICY ROW STORE { COMPRESS ADVANCED } { ROW } AFTER n { day | month | year } OF { NO MODIFICATION } [ ON ( EXPR )]]
    [ TABLESPACE tablespace_name ]
    AS query
    [ WITH [ NO ] DATA ];

参数说明

  • UNLOGGED

    指定表为非日志表。在非日志表中写入的数据不会被写入到预写日志中,这样就会比普通表快很多。但是,非日志表在冲突或异常关机后会被自动删截,非日志表中的内容也不会被复制到备用服务器中,在该类表中创建的索引也不会被自动记录。

    • 使用场景:非日志表不能保证数据的安全性,用户应该在确保数据已经做好备份的前提下使用,例如系统升级时进行数据的备份。
    • 故障处理:当异常关机等操作导致非日志表上的索引发生数据丢失时,用户应该对发生错误的索引进行重建。
  • GLOBAL | LOCAL

    创建临时表时可以在TEMP或TEMPORARY前指定GLOBAL或LOCAL关键字。如果指定GLOBAL关键字,GaussDB会创建全局临时表,否则GaussDB会创建本地临时表。

  • TEMPORARY | TEMP

    如果指定TEMP或TEMPORARY关键字,则创建的表为临时表。临时表分为全局临时表和本地临时表两种类型。创建临时表时如果指定GLOBAL关键字则为全局临时表,否则为本地临时表。

    全局临时表的元数据对所有会话可见,会话结束后元数据继续存在。会话与会话之间的用户数据、索引和统计信息相互隔离,每个会话只能看到和更改自己提交的数据。全局临时表有两种模式:一种是基于会话级别的(ON COMMIT PRESERVE ROWS), 当会话结束时自动清空用户数据;一种是基于事务级别的(ON COMMIT DELETE ROWS), 当执行COMMIT或ROLLBACK时自动清空用户数据。建表时如果没有指定ON COMMIT选项,则缺省为会话级别。与本地临时表不同,全局临时表建表时可以指定非pg_temp开头的SCHEMA。

    本地临时表只在当前会话可见,本会话结束后会自动删除。因此,在除当前会话连接的数据库节点故障时,仍然可以在当前会话上创建和使用临时表。由于临时表只在当前会话创建,对于涉及对临时表操作的DDL语句,会产生DDL失败的报错。因此,建议DDL语句中不要对临时表进行操作。TEMP和TEMPORARY等价。

    • 本地临时表通过每个会话独立的以pg_temp开头的SCHEMA来保证只对当前会话可见,因此,不建议用户在日常操作中手动删除以pg_temp,pg_toast_temp开头的SCHEMA。
    • 如果建表时不指定TEMPORARY/TEMP关键字,而指定表的SCHEMA为当前会话的pg_temp开头的SCHEMA,则此表会被创建为临时表。
    • ALTER/DROP全局临时表和索引,如果其它会话正在使用它,禁止操作。
    • 全局临时表的DDL只会影响当前会话的用户数据和索引。例如TRUNCATE、REINDEX、ANALYZE只对当前会话有效。
  • IF NOT EXISTS

    如果指定IF NOT EXISTS关键字,创建表前会在当前SCHEMA中查找是否已有名字相同的relation。若已有同名relation存在,则不会新建,返回NOTICE提示。未指定IF NOT EXISTS关键字时,若SCHEMA中存在同名relation,返回ERROR告警。

  • table_name

    要创建的表名。

    取值范围:字符串,要符合标识符命名规范

  • column_name

    可选。新表中要创建的字段名。如果没有指定字段名,那么新表的字段名和SELECT语句输入的字段名一致。

    取值范围:字符串,要符合标识符命名规范

  • ENGINE

    B模式下支持,仅语法适配,且只支持设置InnoDB,无实际效果。

  • WITH ( storage_parameter [= value] [, ... ] )

    这个子句为表或索引指定一个可选的存储参数。参数的详细说明如下所示。

    • FILLFACTOR

      一个表的填充因子(fillfactor)是一个介于10和100之间的百分数。在Ustore存储引擎下,该值得默认值为92,在Astore存储引擎下默认值为100(完全填充)。如果指定了较小的填充因子,INSERT操作仅按照填充因子指定的百分率填充表页。每个页上的剩余空间将用于在该页上更新行,这就使得UPDATE有机会在同一页上放置同一条记录的新版本,这比把新版本放置在其他页上更有效。对于一个从不更新的表将填充因子设为100是最佳选择,但是对于频繁更新的表,选择较小的填充因子则更加合适。该参数只对行存表有效。

      取值范围:10~100

    • ORIENTATION

      取值范围:

      ROW(缺省值):表的数据将以行式存储。

    • COMPRESSION

      指定表数据的压缩级别,它决定了表数据的压缩比以及压缩时间。一般来讲,压缩级别越高,压缩比也越大,压缩时间也越长;反之亦然。实际压缩比取决于加载的表数据的分布特征。

      取值范围:

      行存表不支持压缩。

  • ON COMMIT { PRESERVE ROWS | DELETE ROWS }

    ON COMMIT选项决定在事务中执行创建临时表操作,当事务提交时,此临时表的后续操作。当前仅支持PRESERVE ROWS和DELETE ROWS选项。

    • PRESERVE ROWS(缺省值):提交时不对临时表执行任何操作,临时表及其表数据保持不变。
    • DELETE ROWS:提交时删除临时表中数据。
  • [ ILM ADD POLICY ROW STORE { COMPRESS ADVANCED } { ROW } AFTER n { day | month | year } OF { NO MODIFICATION } [ ON ( EXPR )]]

    创建新表时,可以调用ILM ADD POLICY ROW STORE COMPRESS ADVANCED ROW给行存添加高级压缩策略。

    • AFTER n { day | month | year } OF NO MODIFICATION :表示n天/月/年没有修改的行。
    • ON ( EXPR ):行级表达式,用于判断行的冷热。
  • TABLESPACE tablespace_name

    指定新表将要在tablespace_name表空间内创建。如果没有声明,将使用默认表空间。

  • AS query

    一个SELECT VALUES命令或者一个运行预备好的SELECT或VALUES查询的EXECUTE命令。

  • [ WITH [ NO ] DATA ]

    创建表时,是否也插入查询到的数据。默认是要数据,选择“NO”参数时,则不要数据。

示例

  • 不指定字段名时新表字段和SELECT查询结果一致。
    -- 创建test1表并向表中插入2条记录。
    gaussdb=# CREATE TABLE test1(col1 int PRIMARY KEY,col2 varchar(10));
    gaussdb=# INSERT INTO test1 VALUES (1,'col1'),(101,'col101');
    -- 查询表中col1<100的数据。
    gaussdb=# SELECT * FROM test1 WHERE col1 < 100;
     col1 | col2 
    ------+------
        1 | col1
    (1 row)
    
    -- 创建test2表并向表中插入上面查询的数据。
    gaussdb=# CREATE TABLE test2 AS SELECT * FROM test1 WHERE col1 < 100;
    
    -- 查询test2表表结构。
    gaussdb=# \d test2;
     Column |         Type          | Modifiers 
    --------+-----------------------+-----------
     col1   | integer               | 
     col2   | character varying(10) |
  • 为新表指定字段名。
    -- 使用test1复制一个新表test3并指定字段名。
    gaussdb=# CREATE TABLE test3(c1,c2) AS SELECT * FROM test1;
    
    -- 查询test3表结构。
    gaussdb=# \d test3
                Table "public.test3"
     Column |         Type          | Modifiers 
    --------+-----------------------+-----------
     c1     | integer               | 
     c2     | character varying(10) | 
    
    -- 删除。
    gaussdb=# DROP TABLE test1,test2,test3;
  • 为新表指定压缩策略。
    gaussdb=# CREATE TABLE old_table (a int);
    
    --开启数据库ILM特性。
    gaussdb=# ALTER DATABASE SET ILM = on;
    
    gaussdb=# CREATE TABLE ilm_table 
        ILM ADD POLICY ROW STORE COMPRESS ADVANCED 
        ROW AFTER 3 MONTHS OF NO MODIFICATION 
        AS (SELECT * FROM old_table);
    
    --删除。
    gaussdb=# DROP TABLE old_table,ilm_table;

相关链接

CREATE TABLESELECT