记忆库概述
什么是记忆库
记忆库是智能体的记忆中枢,可以通过控制台创建记忆库并配置短期和长期记忆策略,有效抽取并整合上下文信息,完成记忆数据的全生命周期管理。
使用优势:
应用场景
应用场景:适用于智能客服、个人助手、问诊等需跨会话连贯交互的场景,不同场景需要用户偏好等不同记忆策略,以支持跨会话个性化与连续性。
使用价值:提升回答精准度与上下文连贯性,避免用户重复输入,提高智能体运行效率、交互精准度与个性化用户体验,灵活适配各类业务场景需求。
工作原理
记忆库工作原理如下:
- 用户与Agent交互
- 用户通过对话与Agent进行交互。用户可以提出问题、发出指令或进行其他形式的交流。
- Agent接收用户的输入,并对其进行处理。
- Agent与短期记忆的交互
- 添加/删除:Agent将用户的对话内容添加到短期记忆中。同时,Agent也可以根据需要从短期记忆中删除某些信息。
- 查询/检索:Agent可以从短期记忆中查询和检索相关信息,以便更好地理解和回应用户的请求。
- 短期记忆与记忆提取模块的交互
消息数量/会话空闲时间聚合:短期记忆中的信息会根据消息数量或会话空闲时间进行聚合。当满足一定的条件(如达到一定数量的消息或会话空闲时间超过某个阈值)时,短期记忆中的信息会被传递给记忆提取模块。
- 记忆提取模块
- Embedding(向量嵌入):记忆提取模块首先对聚合后的信息进行嵌入处理,将其转换为向量表示。这些向量能够捕捉信息的语义和结构特征。
- Consolidation(巩固):嵌入后的向量会被进一步巩固,可能包括降维、特征提取等操作,以生成更加紧凑和有效的表示。
- Extraction(抽取):从巩固后的向量中抽取关键信息,生成最终的记忆表示。这些记忆表示能够反映用户对话中的重要信息和上下文。
- 向量数据库
记忆提取模块生成的记忆表示会被存储到向量数据库中。向量数据库用于长期存储和管理这些记忆表示,以便后续的查询和使用。
记忆策略说明
- 总结 summary:汇总和压缩会话中的主题、任务、历史决策记录等关键信息。
- 语义记忆 Semantic Memory:从会话记录中识别和提取事实信息和上下文知识的关键片段,包括但不限于事实性知识、概念等。
- 用户偏好 User Preference:从原始会话中提取用户行为模式、关键偏好和选择等信息,为每个用户建立一个持久的、动态更新的用户偏好。
- 情景记忆 Episodic Memory:从对话或经历中提取具有时空序列的具体事件、个人体验和场景细节。