更新时间:2025-08-21 GMT+08:00

将本地数据上传至KooSearch知识库

创建完知识库,需要在知识库中上传知识数据。

场景描述

KooSearch知识库支持上传以下几种类型的知识。

表1 上传数据

上传方式

描述

上传文档

支持上传文档类型的知识,支持格式为 .doc, .docx, .pdf, .pptx, .ppt, .xlsx, .xls, .csv, .wps, .png, .jpg, .jpeg, .bmp, .gif, .tiff, .tif, .webp, .pcx, .ico, .psd, .dps, .et, .txt, .ofd, .md 的多个文档,单个文档不能超过128MB(超过60MB建议通过API上传)。当前版本中图片上传、文档内单张图片上传最大不超过10MB。

上传表格

如果知识库开启了“表格问答”功能。支持上传一份xls、csv、xlsx格式的表格,不能超过128M(超过60MB建议通过API上传)。

注意:

上传的表格中列名不允许为空、表头不允许超过三行,否则解析失败。

不建议上传表头在左侧的表格。

创建FAQ

支持创建问答形式的知识。

批量导入FAQ

支持批量导入问答形式的知识,主要支持xlsx,xls,docx,doc文件类型格式。

上传结构化数据

支持上传结构化知识。支持UTF-8编码的JSONL文件格式,单个文件最大50M,自定义数据长度应在4-1024个字符之间,且文件中仅能使用一种操作。

进入KooSearch控制台

  1. 登录云搜索服务管理控制台
  2. 在左侧导航栏选择“KooSearch>KooSearch文档问答”,进入KooSearch文档问答页面。
  3. 选择已创建好的文档问答服务,单击操作列的“问答”,前往KooSearch控制台。

上传文档

  1. 提前在本地准备好待上传的文档。

    支持格式为 .doc, .docx, .pdf, .pptx, .ppt, .xlsx, .xls, .csv, .wps, .png, .jpg, .jpeg, .bmp, .gif, .tiff, .tif, .webp, .pcx, .ico, .psd, .dps, .et, .txt, .ofd 的多个文档,单个文档不能超过128MB(超过60MB建议通过API上传),当前版本中图片上传、文档内单张图片上传最大不超过10MB。

  2. 在KooSearch控制台,左侧导航栏选择“知识库管理”,进入“知识库管理”页面。
  3. 在知识库管理页面,选择已创建的知识库,单击操作列的“文档管理”,进入“文档管理”页面。
    图1 进入文档管理页面

  4. 默认进入“文档管理”页签,单击“上传”
  5. 在上传对话框中单击“选择文档”,本地选择已提前准备好的文档。重复的文档不允许上传。
    图2 上传文档

  6. 如果需要用标签来分类或者标记文档,可以在“标签”下拉框选择标签,如果没有标签单击“添加标签”去创建一个标签。
  7. 单击“确认”。文档上传后,可在文档管理页签查看已上传的文档,当“文档状态”“正常”,说明文档已上传成功。
  8. 文档上传成功后,可以单击文档名称,进入文档信息详情页查看切片效果,单击页面右边的切片内容可以跳转到原文对应的地方(此功能目前只支持.pdf文件)。
    图3 单击文档名称

    图4 切片效果

  9. 管理文档数据。
    • 单击操作列的“下载”,可下载文档至本地。
    • 单击操作列的“删除”,可删除已上传的文档。
    • 单击操作列的“QA生成”,可将上传的文档生成问答模式的Excel文档,生成任务在“任务管理”页签可以查看。
    • 单击操作列的“重试”,可对已上传的文档重新进行切片。勾选多个文档进行“批量重试”时,生成任务在“任务管理”页签可以查看。单击右侧“重试”按钮单个文档重试时不生成重试任务。
    • 单击操作列的“编辑标签”,可给文档重新选择或创建标签。
    • 如果知识库开启了“表格问答”开关,单击操作列的“表格生成”,可将已上传的excel文档生成表格,生成任务在“任务管理”页签可以查看,生成好后可以在“表格管理”中查看数据表详情。
  10. 目录管理。

    如果知识库开启了“目录管理”开关,就可以节点后单击按钮,在此创建目录,并将文档分类存放。

上传表格

如果您在创建数据库时,开启了“表格问答”按钮,那么知识库详情页面中就会出现“表格管理”页签,该页签支持上传excel文档生成表格数据,在问答过程中利用表格数据,通过NL2SQL问答可提升统计分析类问题的准确率。

支持上传一份xls、csv、xlsx格式的表格,不能超过128M(超过60MB建议通过API上传)。

上传的表格中列名不允许为空、表头不允许超过三行,否则解析失败。

不建议上传表头在左侧的表格。

  1. 在KooSearch控制台,左侧导航栏选择“知识库管理”,进入“知识库管理”页面。
  2. 在知识库管理页面,选择已创建的知识库,单击操作列的“文档管理”

    进入“文档管理”页面。

  3. 单击“表格管理”,切换至“表格管理”页签。
  4. 单击“上传”,依次进行“上传数据表”、“表结构配置”、“数据预览”、“确认入库”操作。
  5. 可在表格管理页签查看已上传的表格。
  6. 管理表格。
    • 单击操作列的“下载”,可下载表格源文件。
    • 单击“表格名称”可预览生成的数据表内容,并且根据列名查询匹配的数据行;表格详情页面单击“导出”支持按xlsx格式导出当前表数据。
    • 单击操作列的“删除”,可删除已创建的表格。

创建FAQ

  1. 在KooSearch控制台,左侧导航栏选择“知识库管理”,进入“知识库管理”页面。
  2. 在知识库管理页面,选择已创建的知识库,单击操作列的“文档管理”

    进入“文档管理”页面。

  3. 单击“FAQ管理”,切换至“FAQ管理”页签。
  4. 单击“创建”,在“新建问答”对话框中输入“标准问题”“答案”,单击“添加相似问题”,可输入多个相似问题。
  5. 在对话框中单击“确认”

    FAQ创建后,可在FAQ管理页签查看已创建的问答。

  6. 管理FAQ。
    • 单击操作列的“编辑”,可重新编辑FAQ。
    • 单击操作列的“删除”,可删除已创建的FAQ。

批量导入FAQ

  1. 提前在本地准备好待导入的FAQ文件。

    主要支持xlsx,xls,docx,doc文件类型格式,文件内容请参考Excel样例文件或Word样例文件。Excel单个文件最大支持10000条数据,文件中不允许空行,空行后的数据将被忽略(超过60MB建议通过API上传)。Word单个文件最大为128M,Word中支持图文格式的FAQ。

  2. 在KooSearch控制台,左侧导航栏选择“知识库管理”,进入“知识库管理”页面。
  3. 在知识库管理页面,选择已创建的知识库,单击操作列的“文档管理”

    进入“文档管理”页面。

  4. 单击“FAQ批量导入”,切换至“FAQ批量导入”页签。
  5. 单击“上传”,在上传对话框中单击“选择文档”,本地选择已提前准备好的FAQ文件。
    图5 FAQ批量导入

  6. 在对话框中单击“确认”

    文件上传后,可在“FAQ批量导入”页签查看已上传的文件,当“导入状态”“正常”,说明文件已导入成功。

  7. 管理FAQ文件。
    • 单击操作列的“下载”,可下载文件至本地。

      如果导入的FAQ数据不满足格式规范将生成异常数据,可根据异常数据进行FAQ文件修改二次上传;上传的FAQ文档同样支持切片数据的增删改查,详情见文档管理下的切片数据增删改查。

    • 单击操作列的“删除”,可删除已上传的文件。

上传结构化数据

  1. 提前在本地准备好待上传的结构化数据文件。

    支持UTF-8无BOM编码的JSONL文件格式,单个文件最大50M,自定义数据长度应在4-1024个字符之间,且文件中仅能使用一种操作。模板如下所示:

    {"cmd":"ADD","id":"100001","content":"content for the first data"}
    {"cmd":"ADD","id":"100002","title":"title for the second data","content":"content for the second data","url":"","docTime":"2015/01/01 12:10:30","category":"category1","tags":["tag1","tag2","tag3"]}
    {"cmd":"UPDATE","id":"100002","content":"The content for the second data is updated","category":"newCategory"}
    {"cmd":"DELETE","id":"100002"}
  2. 在KooSearch控制台,左侧导航栏选择“知识库管理”,进入“知识库管理”页面。
  3. 在知识库管理页面,选择已创建的知识库,单击操作列的“文档管理”,进入“文档管理”页面。
  4. 单击“结构化数据”,切换至“结构化数据”页签。
  5. 单击“上传”,在上传对话框中单击“选择文档”,本地选择已提前准备好的结构化数据文件。
  6. 单击“确认”

    文件上传后,可在结构化数据页签查看已上传的文件,当“导入状态”“正常”,说明文件已上传成功。