知识库集合概述
什么是知识库集合
知识库集合是将用户上传的数据进行切片、模型向量化处理、索引过滤后入库形成的知识集合,按照实际使用维度进行划分。知识库集合本身不存储知识,只用于集中管理知识库。CodeArts代码智能体会基于这些知识库来完成知识的存储和查找。
知识库主要应用于CodeArts代码智能体插件的单元测试生成、代码续写和研发知识问答等场景,可显著提升智能体在这些任务中的准确性和响应效率。
- 根据业务需要将知识按类型整理划分,如通用知识、领域知识和个人知识。
- 新建知识库集合,用于管理知识库。
- 创建知识库并上传知识文件,对知识进行切片、向量化处理后入库存储,请参考管理知识库。
- 在CodeArts代码智能体中引用知识库,检索知识库信息,辅助生成更准确、更相关的信息请参考Knowledge Bases。
知识库集合基本概念
|
基本概念 |
概念说明 |
|---|---|
|
知识库集合 |
知识库的集合,按照实际使用维度进行划分,通常基于知识库进行存储和检索召回。 |
|
知识库 |
知识库集合的二级目录,用于存储和管理各类知识文档,可按照知识的类型和来源进行划分,确保信息的分类更加清晰,提高知识的可读性和可检索性。 |
|
文件 |
文件是知识的载体,知识从导入到检索,需配置正确的加载切片规则、选择合理的向量化模型、设置匹配的索引过滤条件与检索策略,才能确保端到端的检索效果。 |
|
切片 |
切片是知识文件经过加载与切分后形成的文本块,是向量化、存储与召回的基本单元。 |
|
操作日志 |
记录知识库和文件初始化、更新以及删除的操作信息。 |
|
导入状态 |
记录文件的处理状态,包括上传中、加载失败、入库中、入库成功、入库失败、删除中和删除失败七种状态。 |