更新时间:2026-03-10 GMT+08:00
分享

创建茶叶产品介绍知识库

搭建茶叶销售助手前,需要先创建关于茶叶的知识库。

前提条件

准备工作

准备需要上传的知识素材,本实践使用的知识库请参见附录,仅供参考。

创建知识库

  1. 登录AgentArts智能体开发平台,在左侧导航栏“个人空间”区域,选择目标空间。
  2. 单击左侧导航栏开发中心 > 组件库 ,选择“知识库”页签,在“知识库”页面,单击“创建知识库”。
  3. “选择创建类型”弹框中选择“默认”,单击“确定”
  4. “新建知识库”弹框中,填写参数配置信息,填写完成后单击“确定”

    表1 创建知识库

    区域

    参数

    示例

    说明

    基本信息

    知识库图标

    知识库LOGO。单击当前显示的知识库图标,在弹出的对话框中,选择要上传的新图标文件。

    支持jpg、jpeg、png及gif格式,大小不大于200KB。

    知识库名称

    茶叶产品介绍

    用于标识知识库。它是用户在创建知识库时必须填写的字段。

    命名规则:可以包含字母、数字、中文、下划线 _、连字符 -,且必须以字母、数字或中文开头,长度1~50个字符。

    描述

    茶叶产品介绍

    用于对知识库内容和用途的简要说明。它提供了关于知识库的详细信息,帮助用户了解知识库的内容和使用场景。

    命名规则:长度不大于100个字符。

    模型配置

    向量模型

    pangu_embedding

    向量模型是一种将文本、图像等非结构化数据转换为数值向量的模型。例如,在文本处理阶段,用于对文本文档进行切片,转换成向量化表示;在知识检索阶段,根据用户输入的信息对切片进行召回。

    向量模型用于在海量的知识库中,快速识别和用户输入信息语义相近的词或句子,进行信息的初步筛选,解决“大海捞针”的效率问题。

    精排模型

    pangu_rerank

    精排模型是一种用于对检索结构进行精细排序的模型。针对用户输入的信息,对向量模型召回的切片进行从高到低的相关度排序,把相关度最高的前几个信息(例如Top 10)呈现给用户。

    精排模型用于进一步提升系统搜索的相关性精度。

    解析配置

    OCR增强

    去勾选

    开启后,即可调用OCR服务进行智能文档识别,如表格解析或扫描文件等。

    页眉页脚解析

    去勾选

    • 未开启,解析结果中不包含页眉页脚。
    • 开启后,解析结果中包含页眉页脚。

    目录页解析

    勾选

    未开启,解析结果中不包含目录页。

    开启后,解析结果中包含目录页。

    图片解析

    勾选,选择“仅保留原图”

    不开启,则在文档中遇到图片默认跳过,不处理图片。

    开启后,根据需要选择“提取图片文本”或者“仅保留原图”。

    拆分配置

    拆分设置

    自动分段

    系统默认自动分段。支持如下分段策略,分段介绍及分段策略配置请参考知识库分段

    • 自动分段:按照系统默认预设的规则和分隔符切分。
    • 长度分段:基于内容的长度来决定如何进行分段。
    • 层级分段:根据内容的结构层次来进行分段。

  5. 配置完成后,单击“确定”,完成知识库创建。

上传知识文档

  1. 在“知识库”页面,单击知识库列表中的“茶叶产品介绍”名称,进入该知识库详情页面。
  2. 在知识库详情页面选择“知识文档”页签,单击“上传”进入文档上传页面。
  3. 单击“点此上传”,在弹出的对话框中,选择要上传的文档。

    图1 上传文档

  4. 单击“确定”,文件列表中有对应文件,即完成文件上传。

    待文件状态为“成功”,即完成文件解析。

查看文档切片

  1. 在知识库详情页面选择“知识文档”页签,单击“状态”是“成功”的文件名称,进入到文档详情页面。
  2. 左侧是文档基本信息和拆分配置信息,右侧是文档切片信息,如图2所示。

    图2 切片信息

命中测试

  1. 在知识库列表中,单击茶叶产品介绍知识库操作列的“命中测试”。
  2. 在页面左侧文本框中输入问题,并单击“命中测试”。

    命中结果可根据右上方的分值查看结果,分值越高,命中结果越精确。
    图3 命中测试

  3. 在页面右侧将根据不同的检索方式(语义检索、关键词检索、混合检索、FAQ检索),展示多条匹配的内容,并按照匹配分值降序排列。
  4. 用户可以根据分值与匹配到的信息数量来评估当前知识库是否满足需求。

    如果满足需求,则知识库接入完成,您可以在智能体或工作流中使用该知识库。

相关文档

配置本地知识库的详细信息,请参考创建本地知识库

相关文档