Elasticsearch AI搜索介绍
传统搜索引擎依赖关键词匹配,难以捕捉语义关联,且无法处理多模态数据。为突破这一局限,Elasticsearch AI搜索通过集成CSS向量数据库与搜索大模型,构建了具备语义理解、多模态处理和知识问答能力的智能搜索体系。其核心价值在于:
- 语义理解:将文本/非文本数据映射为高维向量,识别深层语义关联。
- 多模态支持:联合检索文本、图像等异构数据。
- 智能问答:通过大语言模型推理生成结构化答案。
方案架构

在Elasticsearch AI搜索方案中,搜索大模型通过插件集成于Elasticsearch集群,负责调度模型服务与向量索引管理;而CSS向量数据库则存储由大模型生成的向量数据,支持高效相似性检索。
数据写入流程:
- 输入原始数据(文本或非文本)。
- 非文本数据先经过OCR服务转换为文本。
- 文本数据通过Embedding模型服务转换为向量。
- 向量数据存储到CSS向量数据库中。
数据查询流程:
- 用户查询Query通过Embedding模型服务转换为向量。
- 在Elasticsearch集群中进行向量相似度搜索,召回TOP K相关文档。
- (可选)通过精排模型服务对结果进行重排序。
- (可选)通过LLM大语言模型对结果进行后处理生成答案。
- 返回最终结果给用户。
使用流程
- 开启搜索大模型插件:在Elasticsearch集群启用搜索大模型插件。具体操作请参见开启搜索大模型插件。
- 配置模型服务:通过搜索大模型插件配置业务所需的模型服务,如Embedding、精排、LLM等模型服务。具体操作请参见配置模型服务。
- 配置索引:将配置好的模型服务关联到向量索引,为索引赋予AI处理能力。具体操作请参见将模型服务关联到向量索引。
- 导入数据:将业务数据写入Elasticsearch集群,系统自动调用搜索大模型进行向量转换和存储。支持通过Bulk接口批量写入向量数据。
- 执行搜索/文档问答:使用multi_match查询语句触发AI搜索流程,系统自动完成语义向量化、多路召回或结果精排,在问答场景还会调用LLM生成结构化答案。语义搜索请参见语义查询。
约束限制
- 集群版本:7.10.2
- 配置要求:已配置Embedding节点(Embedding节点配置处于受限使用阶段,如需使用请提交工单申请开通。)