更新时间:2024-08-20 GMT+08:00

向量数据库参数

maintenance_work_mem

参数说明:指定在维护性操作中使用的最大的内存量。

参数类型:数值型

参数单位:KB

取值范围:[1024,2147483647]/[1MB,2048GB)

默认值:65536/64MB

级别:会话级(session)

diskann_probe_ncandidates

参数说明:表示利用gsdiskann索引检索向量的时候的候选集合大小。

参数类型:数值型

参数单位:\

取值范围:[1, 32768]

默认值:128

级别:会话级(session)

diskann_probe_ncandidates参数可以对于个别使用gsdiskann索引的查询进行设置和生效。此参数设置过大会导致查询性能下降;设置过小会导致召回率不足,推荐设置为128。建议在使用中通过实验获得最优的参数配置。建议只在会话中用set进行设置,不建议使用gs_guc进行全局设置。

gsivfflat_probes

参数说明指定利用gsivfflat检索向量时待搜索的倒排列表的数量,超过gsivfflat索引的倒排列表总数时执行全表搜索。gsivfflat索引的倒排列表总数由创建索引时参数ivf_nlist指定。

参数类型:数值型

参数单位:\

取值范围:[1, 32768]

默认值:5

级别:会话级(session)

gsivfflat_probes设置越大搜索时间越长但是结果更准确,推荐设置为索引创建时参数ivf_nlist取值的3%。建议在使用中通过实验获得最优的参数配置。

gsivfflat_secondary_probes

参数说明指定利用gsivfflat索引检索向量时待搜索的二级倒排列表的数量,超过二级倒排列表总数时执行全表搜索。二级倒排列表总数由创建索引时参数ivf_nlist2指定。

参数类型:数值型

参数单位:\

取值范围:[1, 32768]

默认值:5

级别:会话级(session)

gsivfflat_secondary_probes效果和gsivfflat_probes相同,只有向量索引为双层索引时生效,可以有效加速查询速度,推荐设置为索引创建时参数ivf_nlist2的1/4~1/2之间。建议在使用中通过实验获得最优的参数配置。

enable_vectordb

参数说明:表示是否允许创建向量索引,是否允许对向量索引增加、修改和查询。

参数类型:布尔型

参数单位:无

取值范围

  • on:表示开启。
  • off:表示关闭。

默认值:off

级别:全局参数(SIGHUP)

设置方式:该参数属于SIGHUP类型参数,请参考表1中对应设置方法进行设置。

表1 涉及向量数据库的GUC参数

GUC参数名

级别

取值范围(默认值)

描述

maintenance_work_mem

会话级(session)

[1024,2147483647]/[1MB,2048GB)

(65536/64MB)

指定在维护性操作中使用的最大的内存量。默认单位是KB。

diskann_probe_ncandidates

会话级(session)

[1, 32768](128)

表示利用gsdiskann索引检索向量的时候的候选集合大小。

gsivfflat_probes

会话级(session)

[1, 32768](5)

表示待搜索的倒排列表的数量,超过倒排列表总数时执行全表搜索。

gsivfflat_secondary_probes

会话级(session)

[1, 32768](5)

表示待搜索的二级倒排列表的数量,超过二级倒排列表总数时执行全表搜索。

enable_vectordb

全局参数(SIGHUP)

[off, on](off)

高阶特性,表示是否允许创建向量索引,是否允许对向量索引增加、修改和查询。