将本地数据上传至KooSearch知识库
创建完知识库,需要在知识库中上传知识数据。
场景描述
KooSearch知识库支持上传以下几种类型的知识。
上传方式 |
描述 |
---|---|
支持上传文档类型的知识,支持格式为 .doc, .docx, .pdf, .pptx, .ppt, .xlsx, .xls, .csv, .wps, .png, .jpg, .jpeg, .bmp, .gif, .tiff, .tif, .webp, .pcx, .ico, .psd, .dps, .et, .txt, .ofd, .md 的多个文档,单个文档不能超过128MB(超过60MB建议通过API上传)。当前版本中图片上传、文档内单张图片上传最大不超过10MB。 |
|
如果知识库开启了“表格问答”功能。支持上传一份xls、csv、xlsx格式的表格,不能超过128M(超过60MB建议通过API上传)。
注意:
上传的表格中列名不允许为空、表头不允许超过三行,否则解析失败。 不建议上传表头在左侧的表格。 |
|
支持创建问答形式的知识。 |
|
支持批量导入问答形式的知识,主要支持xlsx,xls,docx,doc文件类型格式。 |
|
支持上传结构化知识。支持UTF-8编码的JSONL文件格式,单个文件最大50M,自定义数据长度应在4-1024个字符之间,且文件中仅能使用一种操作。 |
进入KooSearch控制台
- 登录云搜索服务管理控制台。
- 在左侧导航栏选择“KooSearch>KooSearch文档问答”,进入KooSearch文档问答页面。
- 选择已创建好的文档问答服务,单击操作列的“问答”,前往KooSearch控制台。
上传文档
- 提前在本地准备好待上传的文档。
支持格式为 .doc, .docx, .pdf, .pptx, .ppt, .xlsx, .xls, .csv, .wps, .png, .jpg, .jpeg, .bmp, .gif, .tiff, .tif, .webp, .pcx, .ico, .psd, .dps, .et, .txt, .ofd 的多个文档,单个文档不能超过128MB(超过60MB建议通过API上传),当前版本中图片上传、文档内单张图片上传最大不超过10MB。
- 在KooSearch控制台,左侧导航栏选择“知识库管理”,进入“知识库管理”页面。
- 在知识库管理页面,选择已创建的知识库,单击操作列的“文档管理”,进入“文档管理”页面。
图1 进入文档管理页面
- 默认进入“文档管理”页签,单击“上传”。
- 在上传对话框中单击“选择文档”,本地选择已提前准备好的文档。重复的文档不允许上传。
图2 上传文档
- 如果需要用标签来分类或者标记文档,可以在“标签”下拉框选择标签,如果没有标签单击“添加标签”去创建一个标签。
- 单击“确认”。文档上传后,可在文档管理页签查看已上传的文档,当“文档状态”为“正常”,说明文档已上传成功。
- 文档上传成功后,可以单击文档名称,进入文档信息详情页查看切片效果,单击页面右边的切片内容可以跳转到原文对应的地方(此功能目前只支持.pdf文件)。
图3 单击文档名称图4 切片效果
- 管理文档数据。
- 单击操作列的“下载”,可下载文档至本地。
- 单击操作列的“删除”,可删除已上传的文档。
- 单击操作列的“QA生成”,可将上传的文档生成问答模式的Excel文档,生成任务在“任务管理”页签可以查看。
- 单击操作列的“重试”,可对已上传的文档重新进行切片。勾选多个文档进行“批量重试”时,生成任务在“任务管理”页签可以查看。单击右侧“重试”按钮单个文档重试时不生成重试任务。
- 单击操作列的“编辑标签”,可给文档重新选择或创建标签。
- 如果知识库开启了“表格问答”开关,单击操作列的“表格生成”,可将已上传的excel文档生成表格,生成任务在“任务管理”页签可以查看,生成好后可以在“表格管理”中查看数据表详情。
- 目录管理。
上传表格
如果您在创建数据库时,开启了“表格问答”按钮,那么知识库详情页面中就会出现“表格管理”页签,该页签支持上传excel文档生成表格数据,在问答过程中利用表格数据,通过NL2SQL问答可提升统计分析类问题的准确率。
支持上传一份xls、csv、xlsx格式的表格,不能超过128M(超过60MB建议通过API上传)。

上传的表格中列名不允许为空、表头不允许超过三行,否则解析失败。
不建议上传表头在左侧的表格。
- 在KooSearch控制台,左侧导航栏选择“知识库管理”,进入“知识库管理”页面。
- 在知识库管理页面,选择已创建的知识库,单击操作列的“文档管理”。
进入“文档管理”页面。
- 单击“表格管理”,切换至“表格管理”页签。
- 单击“上传”,依次进行“上传数据表”、“表结构配置”、“数据预览”、“确认入库”操作。
- 可在表格管理页签查看已上传的表格。
- 管理表格。
- 单击操作列的“下载”,可下载表格源文件。
- 单击“表格名称”可预览生成的数据表内容,并且根据列名查询匹配的数据行;表格详情页面单击“导出”支持按xlsx格式导出当前表数据。
- 单击操作列的“删除”,可删除已创建的表格。
创建FAQ
- 在KooSearch控制台,左侧导航栏选择“知识库管理”,进入“知识库管理”页面。
- 在知识库管理页面,选择已创建的知识库,单击操作列的“文档管理”。
进入“文档管理”页面。
- 单击“FAQ管理”,切换至“FAQ管理”页签。
- 单击“创建”,在“新建问答”对话框中输入“标准问题”和“答案”,单击“添加相似问题”,可输入多个相似问题。
- 在对话框中单击“确认”。
FAQ创建后,可在FAQ管理页签查看已创建的问答。
- 管理FAQ。
- 单击操作列的“编辑”,可重新编辑FAQ。
- 单击操作列的“删除”,可删除已创建的FAQ。
批量导入FAQ
- 提前在本地准备好待导入的FAQ文件。
主要支持xlsx,xls,docx,doc文件类型格式,文件内容请参考Excel样例文件或Word样例文件。Excel单个文件最大支持10000条数据,文件中不允许空行,空行后的数据将被忽略(超过60MB建议通过API上传)。Word单个文件最大为128M,Word中支持图文格式的FAQ。
- 在KooSearch控制台,左侧导航栏选择“知识库管理”,进入“知识库管理”页面。
- 在知识库管理页面,选择已创建的知识库,单击操作列的“文档管理”。
进入“文档管理”页面。
- 单击“FAQ批量导入”,切换至“FAQ批量导入”页签。
- 单击“上传”,在上传对话框中单击“选择文档”,本地选择已提前准备好的FAQ文件。
图5 FAQ批量导入
- 在对话框中单击“确认”。
文件上传后,可在“FAQ批量导入”页签查看已上传的文件,当“导入状态”为“正常”,说明文件已导入成功。
- 管理FAQ文件。
- 单击操作列的“下载”,可下载文件至本地。
如果导入的FAQ数据不满足格式规范将生成异常数据,可根据异常数据进行FAQ文件修改二次上传;上传的FAQ文档同样支持切片数据的增删改查,详情见文档管理下的切片数据增删改查。
- 单击操作列的“删除”,可删除已上传的文件。
- 单击操作列的“下载”,可下载文件至本地。
上传结构化数据
- 提前在本地准备好待上传的结构化数据文件。
支持UTF-8无BOM编码的JSONL文件格式,单个文件最大50M,自定义数据长度应在4-1024个字符之间,且文件中仅能使用一种操作。模板如下所示:
{"cmd":"ADD","id":"100001","content":"content for the first data"} {"cmd":"ADD","id":"100002","title":"title for the second data","content":"content for the second data","url":"","docTime":"2015/01/01 12:10:30","category":"category1","tags":["tag1","tag2","tag3"]} {"cmd":"UPDATE","id":"100002","content":"The content for the second data is updated","category":"newCategory"} {"cmd":"DELETE","id":"100002"}
- 在KooSearch控制台,左侧导航栏选择“知识库管理”,进入“知识库管理”页面。
- 在知识库管理页面,选择已创建的知识库,单击操作列的“文档管理”,进入“文档管理”页面。
- 单击“结构化数据”,切换至“结构化数据”页签。
- 单击“上传”,在上传对话框中单击“选择文档”,本地选择已提前准备好的结构化数据文件。
- 单击“确认”。
文件上传后,可在结构化数据页签查看已上传的文件,当“导入状态”为“正常”,说明文件已上传成功。