使用流程

在人工智能时代，随着图像、视频、音频、文本语料等非结构化数据的爆炸式增长，传统的基于关键词的搜索方式已经难以有效地捕捉这些数据深层次的语义或视觉特征。为了应对这一挑战，CSS向量数据库应运而生。CSS向量数据库是一种专门用于存储、管理和检索高维向量数据的数据库系统。它通过将非结构化数据转化为特征向量，并利用近似最近邻（ANN）搜索等技术，提供高性能、高精度的相似性检索服务。

应用场景

CSS向量数据库的典型应用场景广泛，涵盖了多个领域：

以图搜图/视频：用户可以通过上传一张图片或视频片段，在海量数据中快速找到视觉上相似的图片或视频内容。
相似商品推荐：根据用户当前浏览的商品特征，系统能够智能地推荐外观、功能或属性相似的其他商品，提升用户体验和销售转化。
语义文本检索：与传统的关键词匹配不同，向量数据库能够理解文本的深层语义信息，从而返回与用户查询意图更相关的搜索结果，即使文本中不包含完全相同的关键词。
跨模态检索：向量数据库可以实现不同数据类型之间的无缝检索，例如，用户可以使用一段文字描述来搜索相关的图片或视频，打破了数据模态之间的壁垒。
大模型问答（RAG）：在基于大模型的问答系统中，向量数据库作为大模型的外部知识库，提供了高效的专有知识检索能力，确保模型能生成事实准确且与特定领域相关的回答。

方案优势

CSS向量数据库通常具备以下核心优势，使其在处理非结构化数据检索方面表现出色：

高性能：内置高性能向量引擎，支持千万级至亿级向量的毫秒级响应。全面支持暴力检索、图索引（HNSW）、倒排乘积量化（IVF-PQ）等主流索引算法，可根据业务对“精度”与“延迟”的不同偏好灵活切换。
高可靠：依托Elasticsearch/OpenSearch原生分布式架构，具备多副本冗余、快照备份及安全鉴权，确保数据不丢失。
生态兼容：兼容原生Elasticsearch/OpenSearch语法，无需更改既有开发习惯。支持Python、Java、Go等主流语言SDK，并能与Kibana、Dashboards、Logstash等组件对接。
安全性：提供多种安全机制，包括网络隔离、访问控制和数据加密，确保数据的安全性。

原理介绍

CSS向量数据库的核心原理是基于近似最近邻（ANN）搜索，旨在高效地解决K近邻（KNN）问题。KNN问题是指在海量向量数据中找出与给定查询向量最相似的K个结果。ANN搜索通过优化检索效率与精度，避免了计算量巨大的精确KNN计算。其关键技术主要通过以下方式实现：

减少候选集：传统文本检索通过倒排索引过滤无关文档，而向量检索通过构建索引结构（如HNSW图或IVF-PQ）快速定位潜在相关向量，避免全量遍历。例如，HNSW索引通过多层图结构实现快速跳转，显著缩短搜索路径。
降低计算复杂度：漏斗模型先对向量进行粗粒度量化（如IVF-PQ），快速筛选候选集；再对候选集进行精粒度计算（如余弦相似度），平衡性能与精度。量化压缩是通过乘积量化（PQ）将向量编码为低维码本，减少存储和计算开销。
性能与精度平衡：支持动态调整索引参数（如HNSW的层级数、IVF的聚类数），在召回率与响应时间之间灵活权衡。

支持的集群版本

表1 支持CSS向量数据库的集群
集群类型	集群版本
Elasticsearch	7.6.2、7.10.2
OpenSearch	1.3.6、2.19.0

使用流程

图1 CSS向量数据库使用流程
点击放大

表2 CSS向量数据库的使用流程
任务分类	操作		参考文档
使用	环境准备	基于内存规划，准备合适的CSS向量数据库。	准备环境
	索引创建	创建向量索引，定义包含向量字段的Mapping（指定向量维度、索引算法、相似度度量方式等）。	创建向量索引
	数据写入	将特征向量数据（通常连同原始数据或元数据）写入CSS向量数据库。	导入向量数据
	向量检索	使用标准的DSL查询语法搜索目标特征向量，返回与目标向量最相似的K个结果及其相似度分数。	进行向量检索
高级功能	嵌套字段	嵌套字段（Nested）可以在单条文档中存储多条向量数据，在向量检索时，只需一次请求即可扫描所有嵌套向量，并返回最相关的文档。	通过嵌套字段实现向量检索
管理	性能调优	提供CSS向量数据库的写入性能优化和查询性能优化方案。	优化读写性能
管理	缓存管理	通过向量索引缓存管理，灵活监控、调整缓存使用情况，确保查询性能的稳定性和可靠性。	管理向量检索缓存

意见反馈

文档内容是否对您有帮助？

有帮助没帮助

提供反馈

提交成功！非常感谢您的反馈，我们会继续努力做到更好！

系统繁忙，请稍后重试

使用流程

应用场景

方案优势

原理介绍

支持的集群版本

使用流程

相关文档

意见反馈

文档内容是否对您有帮助？