更新时间:2024-11-29 GMT+08:00
LakeSearch基本原理
LakeSearch简介
LakeSearch是一款基于盘古搜索大模型和盘古LLM大语言模型的开箱即用的智慧搜索平台,可以一键式完成知识库构建、文档上传、文档解析拆分、拆分结果向量化、向量入库,帮助企业轻松构建企业内部专属的知识搜索解决方案。
LakeSearch在各个行业中有广泛的应用场景,主要包括门户网站搜索、内部知识搜索、公文检索、金融行业的财务知识共享、智能客服知识搜索、运营商的业务办理指导、业务知识搜索、故障排除搜索等场景。
LakeSearch架构
LakeSearch由SearchServer、SearchFactory两个角色以及前端UI组成。
- SearchServer:提供上传文档、向量入库、语义搜索、RAG问答等能力。
- SearchFactory:提供文档解析和文档拆分能力。
- 文档解析:解析出pdf、doc、docx格式文档的版式、位置坐标、表格结构等内容。
- 文档拆分:拆分文档段落,支持将文档划分为多个段落。
图1 LakeSearch架构
父主题: LakeSearch