更新时间:2026-04-15 GMT+08:00
分享

知识库介绍

功能概述

知识库是组织、存储及管理知识的系统,涵盖文档、图片、视频等信息的分类整理,可以帮助用户高效管理大量的信息。在Agent中添加知识库,使其与用户提供的专业知识库进行交互,可以显著提升Agent的准确度和专业度。

AgentArts支持平台知识库管理和第三方知识库管理。

平台知识库功能对文本文档、FAQ(Frequently Asked Questions,常见问题解答)等数据进行向量化存储、知识检索,支持为应用、工作流提供检索增强能力。无论是文本文档、演示文稿,还是电子表格文件,用户都可以轻松地将数据导入知识库,无需额外的转换或格式处理。

向量化是将文字转换为数字序列的过程,让计算机能通过计算“数字指纹”的相似度,实现基于语义的精准搜索。

图1 文档处理流程

知识库支持导入如表1所示的本地文档:

表1 支持的文档格式

文档类型

文档格式及限制

知识文档

支持上传常见的文档格式,单个文档上传限制最大60MB,文档总数量最多500个,总文档最大1GB。

  • 文档/文本类:doc、docx、pdf、ofd、txt、md、wps。
  • 表格/数据类:xls、xlsx、csv、et。
  • 演示/幻灯片类:ppt、pptx、dps。
  • 图片/设计类:jpg、jpeg、png、gif、bmp、webp、tiff、tif、psd、ico、pcx。

AgentArts支持用户根据需求,将图片类的文件直接存储,或是提取图片文件存储。

FAQ

支持按照模板上传文本,模板文件类型为Word及Excel。

  • 仅支持xlsx、xls、docx、doc格式的文件,单个文件最大为60MB,文档总数量最多500个,总文件最大1GB。
  • Excel单个文件最大支持100000条数据。
    注意:

    文件中不允许空行,空行后的数据将被忽略。

费用说明

  • 平台知识库:知识库存储容量,具体可参考计费模式
  • 第三方知识库:AgentArts侧不计费,具体计费以第三方为准。

应用场景

文旅服务场景:旅游平台可以在知识库中上传景区介绍、游玩路线、周边餐饮和住宿信息、交通时刻表、门票价格及优惠政策,以及当地特色体验项目。当游客查询“周末亲子游景区推荐”时,智能助手会结合适合的年龄段和游玩时长等信息生成定制化方案;当查询“景区门票如何预约”时,会直接调取预约要求与流程。

科研辅助场景:科研人员可以在知识库中上传中英文文献摘要、实验数据记录、参考文献目录和行业标准与研究方法。撰写论文时,智能体通过向量召回相关文献摘要,提取核心结论与数据支撑;设计实验方案时,快速调取同类实验的参数设置和研究方法,对比优劣并优化实验设计,提升研究效率。

智能问答助手场景:企业可以将产品文档、产品使用手册、用户高频咨询的问题合集、产品参数规格表、常见故障排查指南等信息上传至知识库。智能体能够通过精准匹配知识库中的相关信息准确解答用户的问题。

知识与记忆对比

知识:是指Agent通过数据输入获得的信息和理解。这些信息可以是非结构化的(如文档、文章)。

记忆:是指Agent在与用户交互过程中存储和检索的特定信息。这些信息通常是与特定用户或会话相关的,用于提供个性化的服务和上下文相关的响应。

相同点
  • 信息存储

    知识和记忆都涉及信息的存储。无论是知识库中的数据还是会话中的临时信息,都是为了在需要时能够快速访问和使用。

  • 支持决策

    知识和记忆都支持Agent在与用户交互时做出更准确和有效的决策。知识提供广泛的信息基础,而记忆提供具体的上下文信息。

  • 动态性

    知识和记忆都是动态的,需要定期更新和维护。知识库需要定期更新以保持信息的准确性和时效性,而记忆需要在会话过程中不断更新以反映用户的最新交互。

  • 提高用户体验

    知识和记忆都旨在提高用户体验。知识库提供全面的信息支持,帮助用户快速找到答案;记忆则提供个性化的服务,使交互更加自然和连贯。

不同点
  • 存储方式

    知识:通常存储在外部介质中,如数据库、知识图谱、文档等。这些信息是结构化或非结构化的,可以长期保存和共享。

    记忆:通常存储在Agent的内部状态中,如会话状态、用户状态等。这些信息通常是临时的,会随着会话的结束或用户的注销而清除。

  • 信息类型

    知识:涵盖广泛的信息,包括事实、原理、技能、方法等。这些信息是通用的,可以应用于多个用户和场景。

    记忆:涉及特定用户或会话的信息,如用户的查询历史、偏好、上下文信息等。这些信息是个性化的,特定于某个用户或会话。

  • 更新频率

    知识:需要定期更新和维护,以保持信息的准确性和时效性。更新频率可能较低,但每次更新都涉及大量的信息。

    记忆:在每次交互过程中不断更新,以反映用户的最新行为和需求。更新频率较高,但每次更新涉及的信息量较小。

  • 传递性

    知识:知识库可以共享给多个Agent,提高整体的服务质量。

    记忆:通常是特定于某个用户或会话的,不直接传递给其他用户或会话。记忆信息的传递通常需要通过用户标识和会话标识来实现。

  • 应用场景

    知识:广泛应用于常见问题解答、产品信息、政策和法规、最佳实践等。这些信息是通用的,适用于多个用户和场景。

    记忆:主要应用于多轮对话、个性化推荐、用户识别、上下文理解等。这些信息是个性化的,特定于某个用户或会话。

  • 个体差异

    知识:不同Agent的知识水平和获取途径可能不同,但知识本身是客观的,适用于所有用户。

    记忆:不同用户的记忆内容和方式存在显著差异,受用户的特定需求和历史行为影响。

相关文档