更新时间:2025-11-24 GMT+08:00
分享

观测介绍

背景信息

在AI应用的开发和部署过程中,请求调用链往往十分复杂,导致系统行为难以追踪和分析。观测功能的引入,能清晰记录各组件之间的调用顺序,并提供详细的调用路径和时间戳。此外,它还涵盖会话管理、Agent性能指标以及租户使用数据,帮助开发者和运维人员快速定位问题、优化系统性能,提升用户体验和资源利用率。通过这些能力,系统的可维护性和运行效率得到显著增强。

观测通过以下几种方式帮助开发者和运维人员高效管理和优化系统:

  1. 调用链管理:
    • 记录调用顺序:调用链管理功能会记录组件之间的调用顺序,提供清晰的调用路径和时间戳。
    • 快速定位问题:通过详细的调用链记录,开发者可以快速定位系统中的问题,减少故障排查时间。
    • 优化性能:调用链数据可以帮助开发者识别性能瓶颈,优化系统性能。
  2. 会话管理:
    • 会话记录:记录用户与系统的交互过程,帮助开发者理解用户行为和系统响应。
    • 交互逻辑优化:通过分析会话数据,优化对话系统的交互逻辑,提升用户体验。
  3. 应用指标统计:
    • 实时记录:提供实时的性能指标,如Tokens消耗、链路整体耗时等,帮助运维人员及时发现和解决问题。
    • 性能优化:基于性能指标,开发者可以进行针对性的优化,提升系统的运行效率。
  4. 租户指标统计:
    • 资源使用记录:记录和分析当前租户资源的使用情况,帮助优化资源分配。
    • 成本优化:通过资源使用数据,运维人员可以更好地管理资源,降低运营成本。

基础概念

Versatile智能体平台为开发者提供了完整的链路请求调用记录的可视化展示,具体包括以下部分:

  • 链路:是对一次完整请求的详细记录,它完整地呈现了从请求发起到最终返回输出的全生命周期。
  • Span:在链路中,每一个独立的操作步骤称为一个Span,比如一次模型调用或一个函数调用。链路中的第一个Span被称为Root Span,它记录着整个请求的开始和结束。而Root Span下的子Span,则用于记录请求执行过程中更具体、更细粒度的操作信息,帮助了解整个流程的详细上下文。

下图是一次请求的完整数据记录,从请求输入到最终返回结果,链路会记录每一个环节的处理信息。

图1 调用链管理详情

应用场景

模型调用链路优化

  • 示例问题:调用链路中存在多个耗时环节,导致整体响应时间过长。
  • 解决思路:分析调用链路,发现耗时环节。优化API调用逻辑,减少不必要的请求。或增加API缓存机制,减少重复请求。
  • 处理结果:模型调用链路响应时间缩短,用户体验提升。

模型输出质量观察

通过链路追踪计算过程,定位到模型生成的参数与应用预期不符的问题,优化模型后成功解决问题,同时确保了数据处理的安全性和合规性。

  • 示例问题:通过旅游智能助手查询南京的博物馆信息,模型调用博物馆推荐工具,但助手返回“未找到该类型景点”。
  • 解决思路:通过观测模型节点处理的详细信息,发现模型生成的attraction_type参数为“博物馆”,而博物馆推荐应用预期的入参是“文化机构”,导致应用查询返回异常。
  • 处理结果:优化模型Prompt,调整参数名称为“文化机构”,应用调用成功,返回正确博物馆推荐信息。

相关文档