优化数据库语句方法
文档数据库属于NoSQL数据库,提供了可扩展的高性能数据解决方案,与关系型数据库(例如MySQL、SQLServer、Oracle)一样,在数据库设计、语句优化、索引创建等方面都会影响数据库的使用性能。
下面从不同维度,给出提升DDS使用性能的建议。
数据库和集合的创建
- 使用短字段名,以节约存储空间。文档数据库与关系型数据库不同,集合中的每个文档都存储字段名,使用短字段名可以有效的节约存储空间。
- 有效的控制集合中的文档数量,避免影响查询性能。如果有必要,可以进行定期归档。
- 每条文档都提供默认的“_id”值,禁止向“_id”中保存自定义值。
- 固定集合相较其他集合,插入速度快,并且能够自动删除旧数据。用户可以根据业务需要,选择创建固定集合以提高性能。
查询操作
索引
- 根据业务需求,对经常查询的数据字段创建适当的索引。需注意,索引会占用一些空间,并且插入操作和索引更新会消耗资源。因此,建议每个集合的索引数量不超过5个。
- 案例:出现数据查询缓慢,如果没有创建索引,建议对经常查询的数据字段创建适当的索引,优化查询速度。
- 对于包含多个键的查询,建议创建包含这些键的复合索引。复合索引的键值顺序很关键,需遵循索引最左前缀原则,查询应包含最左索引字段,以索引创建顺序为准,与查询字段顺序无关。
- 给索引添加TTL属性,自动筛选过期文档并删除。创建TTL的索引必须是日期类型。TTL索引是单字段索引,而非复合索引。
- 需要在集合中某个字段上创建索引,但当集合中大量文档不包含该键值时,建议创建稀疏索引。
- 创建文本索引时,字段指定text,而不是1或者-1。每个集合只有一个文本索引,但它可以为任意多个字段建立索引。
命令使用
- 使用findOne方法,在数据库中查询匹配多个项目,将会在自然排序文件集合中返回第一个项目。如果需要返回多个文档,则使用find方法。
- 如果查询无需返回整个文档,或只是用来判断键值是否存在,可以通过投影$project来限制返回字段,减少网络流量和客户端的内存使用。
- 除了前缀样式查询,正则表达式查询执行的时间比大多数选择器更久,不建议使用索引。
- 查询中的某些含“$”的操作符可能会降低使用性能。在业务中尽量不要使用该类操作符:$or、$nin、$not、$ne、$exists。
表1 操作符说明 操作符
说明
$or
有多少个条件就会查询多少次,最后合并结果集,建议替换为$in。
$nin
可能会匹配到大多数的索引,此时,查询优化器会退化为全表扫描。
$not
可能会导致查询优化器无法匹配到具体的索引,退化为全表扫描。
$ne
选择字段值不等于指定值的文档,如果多数为取相反值的文档,将会扫描整个索引。
$exists
对于松散的文档结构,查询必须遍历每一个文档。
更多信息,请参见MongoDB官方文档。
- 操作符$where和$exists中不能使用索引。
- 如果查询结果需要排序,尽量控制结果集的数量。
- 涉及多个字段的索引时,尽量将用于精确匹配的字段放在索引的前面。
- 如果查询条件中的键值顺序和复合索引中的创建顺序不一致,DDS会自动优化为查询跟索引顺序一致。