更新时间:2025-08-22 GMT+08:00
分享

Elasticsearch AI搜索介绍

传统搜索引擎依赖关键词匹配,难以捕捉语义关联,且无法处理多模态数据。为突破这一局限,Elasticsearch AI搜索通过集成CSS向量数据库与搜索大模型,构建了具备语义理解、多模态处理和知识问答能力的智能搜索体系。其核心价值在于:

  • 语义理解:将文本/非文本数据映射为高维向量,识别深层语义关联。
  • 多模态支持:联合检索文本、图像等异构数据。
  • 智能问答:通过大语言模型推理生成结构化答案。

方案架构

图1 Elasticsearch AI搜索

在Elasticsearch AI搜索方案中,搜索大模型通过插件集成于Elasticsearch集群,负责调度模型服务与向量索引管理;而CSS向量数据库则存储由大模型生成的向量数据,支持高效相似性检索。

数据写入流程:

  1. 输入原始数据(文本或非文本)。
  2. 非文本数据先经过OCR服务转换为文本。
  3. 文本数据通过Embedding模型服务转换为向量。
  4. 向量数据存储到CSS向量数据库中。

数据查询流程:

  1. 用户查询Query通过Embedding模型服务转换为向量。
  2. 在Elasticsearch集群中进行向量相似度搜索,召回TOP K相关文档。
  3. (可选)通过精排模型服务对结果进行重排序。
  4. (可选)通过LLM大语言模型对结果进行后处理生成答案。
  5. 返回最终结果给用户。

使用流程

  1. 开启搜索大模型插件:在Elasticsearch集群启用搜索大模型插件。具体操作请参见开启搜索大模型插件
  2. 配置模型服务:通过搜索大模型插件配置业务所需的模型服务,如Embedding、精排、LLM等模型服务。具体操作请参见配置模型服务
  3. 配置索引:将配置好的模型服务关联到向量索引,为索引赋予AI处理能力。具体操作请参见将模型服务关联到向量索引
  4. 导入数据:将业务数据写入Elasticsearch集群,系统自动调用搜索大模型进行向量转换和存储。支持通过Bulk接口批量写入向量数据。
  5. 执行搜索/文档问答:使用multi_match查询语句触发AI搜索流程,系统自动完成语义向量化、多路召回或结果精排,在问答场景还会调用LLM生成结构化答案。语义搜索请参见语义查询

约束限制

仅满足以下条件的Elasticsearch集群支持AI搜索功能:
  • 集群版本:7.10.2
  • 配置要求:已配置Embedding节点(Embedding节点配置处于受限使用阶段,如需使用请提交工单申请开通。)

相关文档