更新时间:2024-12-30 GMT+08:00

CREATE DATABASE

功能描述

创建一个新的数据库。缺省情况下新数据库将通过复制标准系统数据库template1来创建。可以通过TEMPLATE template指定不同的模板。

注意事项

  • 只有拥有CREATEDB权限的用户才可以创建新数据库,系统管理员默认拥有此权限。
  • 不能在事务块中执行创建数据库语句。
  • 在创建数据库过程中,若出现类似“could not initialize database directory”的错误提示,可能是由于文件系统上数据目录的权限不足或磁盘满等原因引起。

语法格式

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
CREATE DATABASE database_name
    [ [ WITH ] { [ OWNER [=] user_name ] |
               [ TEMPLATE [=] template ] |
               [ ENCODING [=] encoding ] |
               [ LC_COLLATE [=] lc_collate ] |
               [ LC_CTYPE [=] lc_ctype ] |
               [ DBCOMPATIBILITY [=] compatibility_type ] |
               [ DBCOMPATIBILITY_BEHAVIOR [=] opt_compat_behavior] |
               
               [ CONNECTION LIMIT [=] connlimit ]}[...] ];

参数说明

  • database_name

    数据库名称。

    取值范围:字符串,要符合标识符的命名规范:数据库名称是由大小写英文字母、数字、_和$组合而成,并且不能以数字和$开头。

  • OWNER [ = ] user_name

    数据库所有者。缺省时,新数据库的所有者是当前用户。

    取值范围:已存在的用户名。

  • TEMPLATE [ = ] template

    模板名。即从哪个模板创建新数据库。GaussDB(DWS)采用从模板数据库复制的方式来创建新的数据库。初始时,GaussDB(DWS)包含两个模板数据库template0、template1,以及一个默认的用户数据库gaussdb

    取值范围:已有数据库的名称。不指定时,系统默认拷贝template1。另外,不支持指定为gaussdb数据库。

    目前不支持模板库中含有SEQUENCE对象。如果模板库中有SEQUENCE,则会创建数据库失败。

  • ENCODING [ = ] encoding

    指定数据库使用的字符编码,可以是字符串(如'SQL_ASCII')、整数编号。

    不指定时,默认使用模板数据库的编码。模板数据库template0和template1的编码默认与操作系统环境相关。template1不允许指定字符编码,因此若要创建数据库时指定字符编码,请使用template0创建数据库。即如果需要指定encoding,需要和template参数搭配使用,且template取值为template0。

    常用取值:GBK、UTF8、Latin1。

    • 可使用“show server_encoding;”命令查看当前数据库的字符编码集。
    • 为了适应全球化的需求,使数据库编码能够存储与表示绝大多数的字符,建议创建Database的时候使用UTF8编码。
    • 指定新的数据库字符集编码必须与所选择的本地环境中(LC_COLLATE和LC_CTYPE)的设置兼容。
    • 当指定的字符编码集为GBK时,部分中文生僻字无法直接作为对象名。这是因为GBK第二个字节的编码范围在0x40-0x7E之间时,字节编码与ASCII字符@A-Z[\]^_`a-z{|}重叠。其中@[\]^_'{|}是数据库中的操作符,直接作为对象名时,会语法报错。例如“侤”字,GBK16进制编码为0x8240,第二个字节为0x40,与ASCII“@”符号编码相同,因此无法直接作为对象名使用。如果确实要使用,可以在创建和访问对象时,通过增加双引号来规避这个问题。
    • 当前版本GBK字符集支持了欧元符'€',十六进制表示为'0x80',用户可以在GBK库中操作欧元符,也使得GaussDB(DWS)的GBK字符集可以兼容CP936字符集。需注意GBK字符集约等于CP936字符集,但是GBK字符集中不包含欧元符的定义。
  • LC_COLLATE [ = ] lc_collate

    指定新数据库使用的字符集。例如,通过lc_collate = 'zh_CN.gbk'设定该参数。

    该参数的使用会影响到对字符串的排序顺序(如使用ORDER BY执行,以及在文本列上使用索引的顺序)。默认是使用模板数据库的排序顺序。

    取值范围:有效的排序类型。

  • LC_CTYPE [ = ] lc_ctype

    指定新数据库使用的字符分类。例如,通过lc_ctype = 'zh_CN.gbk'设定该参数。该参数的使用会影响到字符的分类,如大写、小写和数字。默认是使用模板数据库的字符分类。

    取值范围:有效的字符分类。

  • DBCOMPATIBILITY [ = ] compatibility_type

    指定兼容的数据库的类型。

    取值范围:ORA、TD、MySQL。分别表示兼容Oracle、Teradata和MySQL数据库。若不指定该参数,默认为ORA。

  • DBCOMPATIBILITY_BEHAVOIR [ = ] opt_compat_behavior

    指定数据库的兼容性行为。该参数仅9.1.0及以上集群版本支持。若不指定该参数,默认为NO_BEHAVIOR表示无特殊行为。

    取值范围:td_rtrim、pg_char。

    td_rtrim,表示TD兼容模式下变长字符串去尾空。

    pg_char,表示PG兼容模式下varchar类型转为nvarchar2类型。

  • CONNECTION LIMIT [ = ] connlimit

    数据库可以接受的并发连接数。

    取值范围:>=-1的整数。默认值为-1,表示没有限制。

    • 系统管理员不受此参数的限制。
    • 为保证集群正常使用,connection limit的最小值是集群中CN的数目。在集群做ANALYZE时,其他CN节点会连接当前做ANALYZE的CN节点来同步元数据。例如集群中有3个CN节点,那么connection limit应该设置为>=3。

有关字符编码的一些限制:

  • 若区域设置为C(或POSIX),则允许所有的编码类型,但是对于其他的区域设置,字符编码必须和区域设置相同。
  • 编码和区域设置必须匹配模板数据库,除了将template0当作模板。 因为其他数据库可能会包含不匹配指定编码的数据,或者可能包含排序顺序受LC_COLLATE和LC_CTYPE影响的索引。复制这些数据会导致在新数据库中的索引失效。template0是不包含任何会受到影响的数据或者索引。
  • 支持的有效编码类型与当前所处的环境有关。若出现“invalid locale name”的字可通过locale -a命令检查环境所支持的字符编码集。

示例

创建一个GBK编码的数据库music(本地环境的编码格式必须也为GBK):

1
CREATE DATABASE music ENCODING 'GBK' template = template0;

创建数据库music2,并指定所有者为jim:

1
CREATE DATABASE music2 OWNER jim;

用模板template0创建数据库music3,并指定所有者为jim:

1
CREATE DATABASE music3 OWNER jim TEMPLATE template0;

创建兼容ORA格式的数据库:

1
CREATE DATABASE ora_compatible_db DBCOMPATIBILITY 'ORA';

相关链接

ALTER DATABASEDROP DATABASE