知识库集合概述
知识库集合概述
知识库集合是将用户上传的数据进行切片、模型向量化处理、索引过滤后入库形成的知识集合,按照实际使用维度进行划分,知识库集合本身不存储知识,仅方便您管理知识库,通常基于知识库进行存储和检索召回。
主要应用于CodeArts Doer代码智能体插件单元测试生成、代码续写和研发知识问答等场景,可以提高其准确性和响应速度。
- 根据业务需要将知识按类型整理划分,如:通用知识、领域知识、个人知识。
- 新建知识库集合,用于管理知识库。
- 创建知识库并上传知识文件,对知识进行切片、向量化处理后入库存储,请参考管理知识库
- 在CodeArts Doer代码智能体引用知识库,检索知识库信息,辅助生成更准确、更相关的信息。请参考Knowledge Bases。
知识库集合基本概念
|
概念 |
说明 |
|---|---|
|
知识库集合 |
知识库的集合,按照实际使用维度进行划分,通常基于知识库进行存储和检索召回。接口和数据库都采用UTF-8字符集编码。 |
|
知识库 |
知识库集合的二级目录,用于存储和管理各类知识文档,可按照知识的类型和来源进行划分,确保信息的分类更加清晰,提高知识的可读性和可检索性。 |
|
文件 |
文件是知识的载体,知识从导入到检索,需要使用正确的加载切片配置、合理的向量化模型、正确的索引过滤配置以及对应的检索策略,才能确保端到端的效果。 |
|
切片 |
加载切分后的文本块,作为向量化、存储、召回的单位。 |
|
操作日志 |
记录知识库和文件初始化、更新以及删除的操作信息。 |
|
导入状态 |
记录文件的状态,包含上传中、加载失败、入库中、入库成功、入库失败、删除中、删除失败七种状态。 |