更新时间:2026-02-04 GMT+08:00
分享

知识库集合概述

什么是知识库集合

知识库集合是将用户上传的数据进行切片、模型向量化处理、索引过滤后入库形成的知识集合,按照实际使用维度进行划分。知识库集合本身不存储知识,只用于集中管理知识库。CodeArts代码智能体会基于这些知识库来完成知识的存储和查找。

知识库主要应用于CodeArts代码智能体插件的单元测试生成、代码续写和研发知识问答等场景,可显著提升智能体在这些任务中的准确性和响应效率。

图1 知识库集合流程参考图
  1. 根据业务需要将知识按类型整理划分,如通用知识、领域知识和个人知识。
  2. 新建知识库集合,用于管理知识库。
  3. 创建知识库并上传知识文件,对知识进行切片、向量化处理后入库存储,请参考管理知识库
  4. 在CodeArts代码智能体中引用知识库,检索知识库信息,辅助生成更准确、更相关的信息请参考Knowledge Bases

知识库集合基本概念

表1 基本概念

基本概念

概念说明

知识库集合

知识库的集合,按照实际使用维度进行划分,通常基于知识库进行存储和检索召回。

知识库

知识库集合的二级目录,用于存储和管理各类知识文档,可按照知识的类型和来源进行划分,确保信息的分类更加清晰,提高知识的可读性和可检索性。

文件

文件是知识的载体,知识从导入到检索,需配置正确的加载切片规则、选择合理的向量化模型、设置匹配的索引过滤条件与检索策略,才能确保端到端的检索效果。

切片

切片是知识文件经过加载与切分后形成的文本块,是向量化、存储与召回的基本单元。

操作日志

记录知识库和文件初始化、更新以及删除的操作信息。

导入状态

记录文件的处理状态,包括上传中、加载失败、入库中、入库成功、入库失败、删除中和删除失败七种状态。

相关文档