向量检索的性能调优

写入性能优化

关闭副本，待数据导入完成后再开启副本，减少副本构建的开销。
调整“refresh_interval”为120s或者更大，避免频繁刷新索引生成大量小的segments，同时减少merge带来的向量索引构建开销。
适当调大“native.vector.index_threads”的值（默认为4），增加向量索引构建的线程数。
```
PUT _cluster/settings
{
  "persistent": {
    "native.vector.index_threads": 8
  }
}
```

查询性能优化

在批量导入场景下，数据写入完成后，执行forcemerge操作能有效提升查询效率。
```
POST index_name/_forcemerge?max_num_segments=1
```

如果向量索引所需堆外内存超过了熔断线，查询时索引的缓存管理器会控制索引的换进换出，导致查询变慢，此时可适当调大熔断线的配置。
```
PUT _cluster/settings
{
  "persistent": {
    "native.cache.circuit_breaker.cpu.limit": "75%"
  }
}
```

如果端到端时延明显大于返回结果中的took值，说明查询的fetch阶段开销较大，可通过配置“_source”减小fdt文件的大小，从而降低fetch开销。

PUT my_index
{
  "settings": {
    "index": {
      "vector": "true"
    },
    "index.soft_deletes.enabled": false
  },
  "mappings": {
    "_source": {
      "excludes": ["my_vector"]
    },
    "properties": {
      "my_vector": {
        "type": "vector",
        "dimension": 128,
        "indexing": true,
        "algorithm": "GRAPH",
        "metric": "euclidean"
      }
    }
  }
}

父主题： 向量检索

上一篇：向量查询

下一篇：（可选）预构建与注册

意见反馈

文档内容是否对您有帮助？

有帮助没帮助

提供反馈

提交成功！非常感谢您的反馈，我们会继续努力做到更好！

系统繁忙，请稍后重试