数据库使用规范

更新时间：2024-12-31 GMT+08:00

查看PDF

数据库命名规范

所有的数据库对象名称（包括库名、表名、列名等）建议以小写字母命名，每个单词之间用下划线分隔。
所有的数据库对象名称禁止使用RDS for MariaDB保留关键字。
数据库对象的命名要能做到见名知意，并且不超过32个字符。
数据库中用到的临时表以“tmp”为前缀并以日期为后缀。
数据库中用到的备份表以“bak”为前缀并以日期为后缀。
在不同的库或表中，要保证所有存储相同数据的列名和列类型必须一致。

数据库基本设计规范

所有表如果没有特殊需求，都要使用InnoDB存储引擎。InnoDB存储引擎支持事务、行级锁、具有更好的恢复性、高并发下性能更强。
数据库和表的字符集统一使用UTF8字符集，避免由于字符集的转换产生乱码。
所有的表和字段都需要添加注释。使用comment从句添加表和列的备注，从设计初期维护好数据字典。
谨慎使用RDS for MariaDB分区表，避免跨分区查询，否则查询效率会降低。分区表在逻辑上表现为一个表，但是在物理层面上将数据存储在多个文件。建议尽可能将分区表的不同分区文件存储在不同的磁盘阵列上。
表中的列不要太多，尽量做到冷热数据分离，减小表的宽度，以便在一页内存中容纳更多的行，进而减少磁盘IO，更有效的利用缓存。
经常一起使用的列尽量放到一个表中，避免过多的关联操作。
禁止在表中建立预留字段，否则修改列的类型会导致锁表，修改一个字段类型的成本要高于增加一个字段。
禁止在数据库中存储图片、文件等大的二进制数据。

数据库字段设计规范

优先为表中的每一列选择符合存储需要的最小的数据类型。优先考虑数字类型，其次为日期或二进制类型，最后是字符类型。列的字段类型越大，建立索引占据的空间就越大，导致一个页中的索引越少，造成IO次数增加，从而影响性能。
整数型选择能符合需求的最短列类型，如果为非负数，声明需是无符号（UNSIGNED）类型。
每个字段尽可能具有NOT NULL属性。
避免使用ENUM类型，可以用TINYINT类型替换。修改ENUM值需要使用ALTER语句，ENUM类型的ORDER BY操作效率低，需要额外操作。
如果定义了禁止ENUM的枚举值是数值，可使用其他数据类型（如CHAR类型）。
实数类型使用DECIMAL，禁止使用FLOAT和DOUBLE类型。FLOAT和DOUBLE在存储的时候，存在精度损失的问题，很可能在值的比较时，得到错误的结果。
使用DATETIME、TIMESTAMP类型来存储时间，禁止使用字符串替代。
使用数字类型INT UNSIGNED存储IP地址，用INET_ATON、INET_NTOA可以在IP地址和数字类型之间转换。
VARCHAR类型的长度应该尽可能短。VARCHAR类型虽然在硬盘上是动态长度的，但是在内存中占用的空间是固定的最大长度。
使用VARBINARY存储大小写敏感的变长字符串，VARBINARY默认区分⼤小写，没有字符集概念，速度快。

数据库索引设计规范

限制每张表上的索引数量，建议单张表索引不超过5个。索引并不是越多越好，索引可以提高查询的效率，但会降低写数据的效率。有时不恰当的索引还会降低查询的效率。
禁止给表中的每一列都建立单独的索引。设计良好的联合索引比每一列上的单独索引效率要高出很多。
每个InnoDB表强烈建议有一个主键，且不使用更新频繁的列作为主键，不使用多列主键，不使用UUID、MD5、字符串列作为主键。最好选择值的顺序是连续增长的列作为主键，所以建议选择使用自增ID列作为主键。
建议在下面的列上建立索引：
- 在SELECT，UPDATE，DELETE语句的WHERE从句上的列。
- 在ORDER BY，GROUP BY，DISTINCT上的列。
- 多表JOIN的关联列。
索引列顺序：
- 区分度最高的列放在联合索引的最左侧。区分度=列中不同值的数量/列的总行数。
- 尽量把字段长度小的列放在联合索引的最左侧。因为字段长度越小，一页能存储的数据量越大，IO性能也就越好。
- 使用最频繁的列放到联合索引的左侧。这样可以比较少的建立一些索引。
避免冗余的索引，例如：primary key(id)，index(id)，unique index(id)
避免重复的索引，例如：index(a,b,c)，index(a,b)，index(a)，由于RDS for MariaDB查询优化器无法确定使用哪个索引，所以重复的和冗余的索引会降低查询效率。
在VARCHAR字段上建立索引时，需指定索引长度，没必要对全字段建立索引，根据实际文本区分度决定索引长度即可。
一般对字符串类型数据，长度为20的索引，区分度会高达90%以上，可以使用 count(distinct left(列名, 索引长度))/count(*) 的区分度来确定。
对于频繁查询优先考虑使用覆盖索引。
覆盖索引指包含了所有查询字段的索引，不仅仅是WHERE从句GROUP BY从句中的列，也包含SELECT查询的列组合，避免InnoDB表进行索引的二次查询。
外键约束：
建立外键关系的对应列的字符集必须保持一致或者存在外键关系的子表父表的字符集保持一致。

数据库SQL开发规范

在程序中，建议使用预编译语句进行数据库操作。预编译只编译一次，以后在该程序中就可以调用多次，比SQL效率高。
避免数据类型的隐式转换，隐式转换会导致索引失效。
禁止在WHERE从句中对列进行函数转换和计算，会导致索引失效。
避免使用双%号或前置%号的查询条件，这样无法利用到索引。
禁止在查询中使用SELECT *语句。原因如下：
- 使用SELECT *会消耗更多的CPU和IP以及网络带宽资源。
- 使用SELECT *无法使用覆盖索引。
- 不使用SELECT *可以减少表结构变更对代码带来的影响。
避免使用子查询，子查询会产生临时表，临时表没有任何索引，数据量大时严重影响效率。建议将子查询转化成关联查询。
避免使用JOIN关联太多的表，建议不要超过5个表的JOIN操作。需要JOIN的字段，数据类型必须一致。
每关联一个表会多占用一部分内存（由“join_buffer_size”控制），会产生临时表操作，影响查询效率。
尽量减少同数据库的交互次数，数据库更适合处理批量操作。
使用IN代替OR，IN操作可以有效地利用索引，IN的值不要超过500个
不使用反向查询，例如：NOT IN、NOT LIKE
禁止使用ORDER BY RAND()进行随机排序。
该操作会将表中所有符合条件的数据装载到内存中进行排序，消耗大量的CPU和IO及内存资源。

推荐在程序中获取一个随机值，然后根据随机值从数据库获取数据。
在不需要去重的情况下，要使用UNION ALL代替UNION。
UNION ALL不需要对结果集再进⾏排序。
合并多个相同操作到一起，可以提高处理效率，数据库更适合处理批量操作。
通过批量操作减少同数据库交互次数。
超过100万行的批量写操作，要分批多次进行操作。
大批量写操作可能会造成严重的主从延迟。
如果有ORDER BY的场景，请注意利用索引的有序性。
- ORDER BY最后的字段是组合索引的一部分，并且放在索引组合顺序的最后。
- 避免出现file_sort的情况，影响查询性能。
正例：WHERE a=? AND b=? ORDER BY c;，索引：a_b_c

反例：索引中有范围查找，那么索引的有序性无法利用，例如：WHERE a>10 ORDER BY b;，索引a_b无法排序。

父主题：使用规范

上一篇：实例使用规范

下一篇：连接实例

意见反馈

文档内容是否对您有帮助？

有帮助没帮助

提供反馈

提交成功！非常感谢您的反馈，我们会继续努力做到更好！

系统繁忙，请稍后重试

在使用文档中是否遇到以下问题

内容与产品页面不一致

内容不易理解

缺失示例代码

步骤不可操作

搜不到想要的内容

缺少最佳实践

意见反馈（选填）

0/500

请至少选择一项反馈信息并填写问题反馈

字符长度不能超过500

直接提交取消

数据库使用规范

数据库命名规范

数据库基本设计规范

数据库字段设计规范

数据库索引设计规范

数据库SQL开发规范

意见反馈

文档内容是否对您有帮助？

文档反馈