CREATE DATABASE
功能描述
创建新的数据库。
DWS采用从模板数据库复制的方式来创建新的数据库。DWS系统提供了两个模板数据库(template0和template1)以及一个默认的用户数据库(gaussdb)。默认情况下,新的数据库基于template1创建。template1不允许修改字符编码,因此若要变更编码,用户可以通过指定template参数选择template0模板。
注意事项
- 只有拥有CREATEDB权限的用户才可以创建新数据库,系统管理员默认拥有此权限。
- CREATE DATABASE不能在事务块中执行。
- 在创建数据库过程中,若出现类似“could not initialize database directory”的错误提示,可能是由于文件系统上数据目录的权限不足或磁盘满等原因引起。
语法格式
1 2 3 4 5 6 7 8 9 10 |
CREATE DATABASE database_name [ [ WITH ] { [ OWNER [=] user_name ] | [ TEMPLATE [=] template ] | [ ENCODING [=] encoding ] | [ LC_COLLATE [=] lc_collate ] | [ LC_CTYPE [=] lc_ctype ] | [ DBCOMPATIBILITY [=] compatibility_type ] | [ DBCOMPATIBILITY_BEHAVIOR [=] opt_compat_behavior] | [ CONNECTION LIMIT [=] connlimit ]}[...] ]; |
参数说明
参数 |
描述 |
取值范围 |
---|---|---|
database_name |
要创建的数据库名称。 |
字符串,需符合标识符命名规范。 |
user_name |
指定新数据库所有者的名称。缺省时,新数据库的所有者是当前用户。 |
已存在的用户名。 |
template |
创建新数据库时指定的模板名称,即使用哪个模板创建新数据库。不指定时,系统默认使用template1作为模板。 |
template0和template1。
|
encoding |
指定数据库使用的字符集编码,可以是字符串(如'SQL_ASCII')、整数编号。不指定时,默认使用模板数据库的编码。
|
常用取值为GBK、UTF8、Latin1、SQL_ASCII。 |
lc_collate |
指定新数据库使用的字符集。例如,通过lc_collate = 'zh_CN.gbk'设定该参数。 该参数的使用会影响到对字符串的排序顺序(例如使用ORDER BY的查询中,以及在文本列上使用索引的顺序)。默认使用模板数据库的排序顺序。有关其他限制请参考字符集编码的说明。 |
有效的排序类型。 |
lc_ctype |
指定新数据库使用的字符分类。例如,通过lc_ctype = 'zh_CN.gbk'设定该参数。 该参数的使用会影响到字符的分类,如大写、小写和数字。默认是使用模板数据库的字符分类。 |
有效的字符分类。 |
compatibility_type |
指定兼容的数据库的类型。若不指定该参数,默认为ORA。 |
ORA、TD或MySQL。 分别表示兼容Oracle、Teradata或MySQL数据库。 |
opt_compat_behavior |
指定数据库的兼容性行为。该参数仅9.1.0及以上集群版本支持。若不指定该参数,默认为NO_BEHAVIOR,表示无特殊行为。 |
td_rtrim或pg_char。
|
connlimit |
指定数据库的并发连接数。默认值为-1,表示没有限制。
|
大于等于-1的整数。 |
字符集编码的说明
- 可使用“show server_encoding;”命令查看当前数据库的字符集编码。
- 为了适应全球化的需求,使数据库编码能够存储与表示绝大多数的字符,建议创建数据库时使用UTF8编码。
- 指定新的数据库字符集编码必须与所选择的语言环境中(LC_COLLATE和LC_CTYPE)的设置兼容。
- 若语言环境设置为C(或POSIX),则允许所有的编码类型,但是对于其他的语言环境设置,字符集编码必须和区域设置相同。
- 编码和区域设置必须匹配模板数据库,除了将template0当作模板。 因为其他数据库可能会包含不匹配指定编码的数据,或者可能包含排序顺序受LC_COLLATE和LC_CTYPE影响的索引。复制这些数据会导致在新数据库中的索引失效。template0是不包含任何会受到影响的数据或者索引。
- 支持的有效编码类型与当前所处的环境有关。若出现“invalid locale name”的字可通过locale -a命令检查环境所支持的字符集编码。
- 当指定的字符集编码为GBK时,部分中文生僻字无法直接作为对象名。这是因为GBK第二个字节的编码范围在0x40-0x7E之间时,字节编码与ASCII字符@A-Z[\]^_`a-z{|}重叠。其中@[\]^_'{|}是数据库中的操作符,直接作为对象名时,会语法报错。例如“侤”字,GBK16进制编码为0x8240,第二个字节为0x40,与ASCII“@”符号编码相同,因此无法直接作为对象名使用。如果确实要使用,可以在创建和访问对象时,通过增加双引号来规避这个问题。
- 当前版本GBK字符集支持了欧元符'€',十六进制表示为'0x80',用户可以在GBK库中操作欧元符,也使得DWS的GBK字符集可以兼容CP936字符集。需注意GBK字符集约等于CP936字符集,但是GBK字符集中不包含欧元符的定义。
- 9.1.1.100及以上集群版本支持使用GB18030、GB18030-2022字符集创建数据库,需要注意的是只支持GB18030/GB18030-2022到UTF8之间的映射,所以必须设置client_encoding参数为UTF-8。
示例
创建一个GBK编码的数据库music(本地环境的编码格式必须也为GBK)。
1
|
CREATE DATABASE music ENCODING 'GBK' template = template0; |
创建数据库music2,并指定所有者为jim。
1
|
CREATE DATABASE music2 OWNER jim; |
用模板template0创建数据库music3,并指定所有者为jim。
1
|
CREATE DATABASE music3 OWNER jim TEMPLATE template0; |
创建兼容ORA格式的数据库,连接限制为10。
1
|
CREATE DATABASE ora_compatible_db DBCOMPATIBILITY 'ORA'CONNECTION LIMIT = 10; |
创建兼容GB18030编码的数据库db_gb18030(本地环境的编码格式必须也是GB18030)。
1
|
CREATE DATABASE db_gb18030 encoding='gb18030' LC_COLLATE='zh_CN.GB18030' LC_CTYPE ='zh_CN.GB18030' TEMPLATE=template0; |
创建兼容GB18030-2022编码的数据库db_gb180302022(本地环境的编码格式必须也是GB18030)。
1
|
CREATE DATABASE db_gb180302022 encoding='gb18030_2022' LC_COLLATE='zh_CN.GB18030' LC_CTYPE ='zh_CN.GB18030' TEMPLATE=template0; |