CodeArts盘古助手
CodeArts盘古助手
- 最新动态
- 产品介绍
- 快速入门
- 用户指南
- 最佳实践
-
常见问题
- JetBrains系列IDE版本的插件研发问答窗口空白如何解决?
- 在Intellij IDEA安装插件失败,提示内容为CodeArts盘古助手插件的lib目录
- 使用CodeArts盘古助手时提示“请求超时!请检查您的代理和host配置”
- 使用CodeArts盘古助手时提示“计算资源紧张,请稍后再试”
- 使用CodeArts盘古助手时提示“代码生成暂无结果”
- 使用CodeArts盘古助手时提示“请登录后再使用”
- 使用CodeArts盘古助手时提示当前的账号权限不足
- 使用CodeArts盘古助手时提示尚未获得此服务的使用授权
- 使用CodeArts盘古助手时提示尚未获得此功能的访问权限
- CodeArts盘古助手域名访问问题说明
- CodeArts盘古助手数据归属和安全问题
- 文档下载
- 通用参考
链接复制成功!
RAG知识库资产管理
约束与限制
- 上传文档限制
- 本地文件:支持TXT、DOCX格式文件,单个文件最大支持20MB。
- 代码文件:仅支持JAVA、PYTHON、C、C++文件的ZIP格式,单个文件最大支持20MB,单个资产配额50MB。
- 入库配置限制
- 中文文本嵌入模型m3e-base:该模型是适用于中英文文本的通用型768维度的嵌入模型。
- 中文版文本表示模型bge-large-zh-v1.5:该模型适用于检索、分类、聚类或语义匹配等任务,目前仅支持中文文本。
- 向量计算模型paraphrase-multilingual-MiniLM-L12-v2:该模型适用于中英文文本,在文本相似度计算中表现优异,模型维度364。
- 华为自研代码专用模型VESO-v1.2:该模型在代码数据向量化、代码搜索任务中表现突出。
- 高级配置
- 切分器:不同的切分器的切片方式和结果不同,在不同的语言场景下可以选择不同的切分器,当前只支持中文切分器。
- 分段预计长度:分片长度的取值范围为50-1000,默认值为300。
创建知识库资产
- 单击已创建好的知识库卡片,可进入当前知识库新建资产页面。
- 单击页面左上角“新建资产”,弹出新建资产对话框。
图1 新建资产对话框
- 填写资产名称,上传相应的文档。当前上传文件只支持本地文件和代码文件两种文件类型。
- 单击下一步,进入入库配置页面。选择一个Embedding模型,对上传的文档进行向量化,当前提供四个模型可供选择。
图2 入库配置页面
- 在入库配置页面,按需配置“高级配置”中的“分段预计长度”。
- 单击“确定”,知识库资产创建完毕,如图3所示,为创建好的知识库资产列表。
删除知识库资产
在每个知识库手册的右边,可以通过单击操作处的按钮删除知识库资产。
父主题: 使用RAG知识库