数据库设计规范
- 使用JDBC客户端连接数据库时必须指明数据库名,具体格式为:
jdbc:postgresql://host:port/database?param1=value1¶m2=value2
- JDBC实例一旦创建,无法进行数据库切换。
- 数据库目前不支持不区分大小写的排序方式。
- 目前仅支持对数据库定义字符集,不支持对表、字段等其他对象定义字符集。
- 业务使用前必须先创建业务数据库。
不应使用数据库安装后默认创建的postgres数据库存储业务数据。
- 创建数据库时必须指定字符集为UTF8,创建数据库时必须选择与客户端统一的编码字符集。
为了使用全球化需求,数据库编码应能够存储与标识绝大多数的字符,因此推荐使用UTF8。GaussDB中的UTF8字符集与MySQL数据库的UTF8MB4等价,能够支持emoji表情字符。
如果客户端的编码方式与数据库的编码方式不统一,需要转码,会带来性能问题,同时,针对同编码的内核优化无法触发,影响查询效率。
客户端的编码字符集需通过以下方式修改:
- 设置客户端连接参数,例如JDBC连接参数可通过在URL中追加characterEncoding和allowEncodingChanges参数。
jdbc:postgresql://ip:port/database_name?characterEncoding=utf8&allowEncodingChanges=true
- 修改数据库GUC参数。
SET client_encoding = 'UTF8';
- 数据库的编码在CREATE DATABASE时进行设置。
CREATE DATABASE tester WITH ENCODING = 'UTF8';
- 设置客户端连接参数,例如JDBC连接参数可通过在URL中追加characterEncoding和allowEncodingChanges参数。
- 数据库一旦创建无法更改字符集。
- 从便捷性和资源共享效率上考虑,建议使用SCHEMA进行业务隔离。
GaussDB可以使用DATABASE和SCHEMA两种方式实现业务的隔离。
区别在于DATABASE的隔离更加彻底,各个DATABASE之间共享资源极少,可实现连接隔离、权限隔离等。
但DATABASE之间无法互相访问,JDBC建连时必须指明DATABASE,连接后无法切换DATABASE。
SCHEMA隔离的方式共用资源较多,可以通过GRANT与REVOKE语法便捷地控制不同用户对各SCHEMA及其下属对象的权限。
- 创建数据库时建议指定LC_COLLATE和LC_CTYPE和存放的数据内容语言(中文\英文\等等)一致,该参数将影响数据的排序顺序。默认会用系统当前环境变量的默认设置。
CREATE DATABASE tester WITH ENCODING = 'UTF8' LC_COLLATE = 'en_US.UTF-8' LC_CTYPE = 'en_US.UTF-8';
LC_COLLATE:用于明确字符排序规则。
LC_COLLATE=C 1 2 3 A B C a --注:小写在大写后面,按ASCII码排序 b c en_US.UTF-8 1 2 3 a --注:按字符排序 A b B c C zh_CN.UTF-8 1 2 3 a A b B c C
LC_CTYPE:用于判断哪些是字符is_alpha,是大写is_upper还是小写is_lower。