知识库介绍
功能概述
知识库是组织、存储及管理知识的系统,涵盖文档、图片、视频等信息的分类整理,可以帮助用户高效管理大量的信息。在Agent中添加知识库,使其与用户提供的专业知识库进行交互,可以显著提升Agent的准确度和专业度。
AgentArts支持平台知识库管理和第三方知识库管理。
平台知识库功能对文本文档、FAQ(Frequently Asked Questions,常见问题解答)等数据进行向量化存储、知识检索,支持为应用、工作流提供检索增强能力。无论是文本文档、演示文稿,还是电子表格文件,用户都可以轻松地将数据导入知识库,无需额外的转换或格式处理。
向量化是将文字转换为数字序列的过程,让计算机能通过计算“数字指纹”的相似度,实现基于语义的精准搜索。
知识库支持导入如表1所示的本地文档:
|
文档类型 |
文档格式及限制 |
|---|---|
|
知识文档 |
支持上传常见的文档格式,单个文档上传限制最大60MB,文档总数量最多500个,总文档最大1GB。
AgentArts支持用户根据需求,将图片类的文件直接存储,或是提取图片文件存储。 |
|
FAQ |
支持按照模板上传文本,模板文件类型为Word及Excel。
|
费用说明
- 平台知识库:知识库存储容量,具体可参考计费模式。
- 第三方知识库:AgentArts侧不计费,具体计费以第三方为准。
应用场景
文旅服务场景:旅游平台可以在知识库中上传景区介绍、游玩路线、周边餐饮和住宿信息、交通时刻表、门票价格及优惠政策,以及当地特色体验项目。当游客查询“周末亲子游景区推荐”时,智能助手会结合适合的年龄段和游玩时长等信息生成定制化方案;当查询“景区门票如何预约”时,会直接调取预约要求与流程。
科研辅助场景:科研人员可以在知识库中上传中英文文献摘要、实验数据记录、参考文献目录和行业标准与研究方法。撰写论文时,智能体通过向量召回相关文献摘要,提取核心结论与数据支撑;设计实验方案时,快速调取同类实验的参数设置和研究方法,对比优劣并优化实验设计,提升研究效率。
智能问答助手场景:企业可以将产品文档、产品使用手册、用户高频咨询的问题合集、产品参数规格表、常见故障排查指南等信息上传至知识库。智能体能够通过精准匹配知识库中的相关信息准确解答用户的问题。
知识与记忆对比
知识:是指Agent通过数据输入获得的信息和理解。这些信息可以是非结构化的(如文档、文章)。
记忆:是指Agent在与用户交互过程中存储和检索的特定信息。这些信息通常是与特定用户或会话相关的,用于提供个性化的服务和上下文相关的响应。
- 存储方式
知识:通常存储在外部介质中,如数据库、知识图谱、文档等。这些信息是结构化或非结构化的,可以长期保存和共享。
记忆:通常存储在Agent的内部状态中,如会话状态、用户状态等。这些信息通常是临时的,会随着会话的结束或用户的注销而清除。
- 信息类型
知识:涵盖广泛的信息,包括事实、原理、技能、方法等。这些信息是通用的,可以应用于多个用户和场景。
记忆:涉及特定用户或会话的信息,如用户的查询历史、偏好、上下文信息等。这些信息是个性化的,特定于某个用户或会话。
- 更新频率
知识:需要定期更新和维护,以保持信息的准确性和时效性。更新频率可能较低,但每次更新都涉及大量的信息。
记忆:在每次交互过程中不断更新,以反映用户的最新行为和需求。更新频率较高,但每次更新涉及的信息量较小。
- 传递性
记忆:通常是特定于某个用户或会话的,不直接传递给其他用户或会话。记忆信息的传递通常需要通过用户标识和会话标识来实现。
- 应用场景
知识:广泛应用于常见问题解答、产品信息、政策和法规、最佳实践等。这些信息是通用的,适用于多个用户和场景。
记忆:主要应用于多轮对话、个性化推荐、用户识别、上下文理解等。这些信息是个性化的,特定于某个用户或会话。
- 个体差异
知识:不同Agent的知识水平和获取途径可能不同,但知识本身是客观的,适用于所有用户。
记忆:不同用户的记忆内容和方式存在显著差异,受用户的特定需求和历史行为影响。