观测介绍

背景信息

在AI应用的开发和部署过程中，请求调用链往往十分复杂，导致系统行为难以追踪和分析。观测功能的引入，能清晰记录各组件之间的调用顺序，并提供详细的调用路径和时间戳。此外，它还涵盖会话管理、Agent性能指标以及租户使用数据，帮助开发者和运维人员快速定位问题、优化系统性能，提升用户体验和资源利用率。通过这些能力，系统的可维护性和运行效率得到显著增强。

观测通过以下几种方式帮助开发者和运维人员高效管理和优化系统：

调用链管理：
- 记录调用顺序：调用链管理功能会记录组件之间的调用顺序，提供清晰的调用路径和时间戳。
- 快速定位问题：通过详细的调用链记录，开发者可以快速定位系统中的问题，减少故障排查时间。
- 优化性能：调用链数据可以帮助开发者识别性能瓶颈，优化系统性能。
会话管理：
- 会话记录：记录用户与系统的交互过程，帮助开发者理解用户行为和系统响应。
- 交互逻辑优化：通过分析会话数据，优化对话系统的交互逻辑，提升用户体验。
应用指标统计：
- 实时记录：提供实时的性能指标，如Tokens消耗、链路整体耗时等，帮助运维人员及时发现和解决问题。
- 性能优化：基于性能指标，开发者可以进行针对性的优化，提升系统的运行效率。
租户指标统计：
- 资源使用记录：记录和分析当前租户资源的使用情况，帮助优化资源分配。
- 成本优化：通过资源使用数据，运维人员可以更好地管理资源，降低运营成本。

基础概念

Versatile智能体平台为开发者提供了完整的链路请求调用记录的可视化展示，具体包括以下部分：

链路：是对一次完整请求的详细记录，它完整地呈现了从请求发起到最终返回输出的全生命周期。
Span：在链路中，每一个独立的操作步骤称为一个Span，比如一次模型调用或一个函数调用。链路中的第一个Span被称为Root Span，它记录着整个请求的开始和结束。而Root Span下的子Span，则用于记录请求执行过程中更具体、更细粒度的操作信息，帮助了解整个流程的详细上下文。

下图是一次请求的完整数据记录，从请求输入到最终返回结果，链路会记录每一个环节的处理信息。

图1 调用链管理详情
点击放大

应用场景

模型调用链路优化

示例问题：调用链路中存在多个耗时环节，导致整体响应时间过长。
解决思路：分析调用链路，发现耗时环节。优化API调用逻辑，减少不必要的请求。或增加API缓存机制，减少重复请求。
处理结果：模型调用链路响应时间缩短，用户体验提升。

模型输出质量观察

通过链路追踪计算过程，定位到模型生成的参数与应用预期不符的问题，优化模型后成功解决问题，同时确保了数据处理的安全性和合规性。

示例问题：通过旅游智能助手查询南京的博物馆信息，模型调用博物馆推荐工具，但助手返回“未找到该类型景点”。
解决思路：通过观测模型节点处理的详细信息，发现模型生成的attraction_type参数为“博物馆”，而博物馆推荐应用预期的入参是“文化机构”，导致应用查询返回异常。
处理结果：优化模型Prompt，调整参数名称为“文化机构”，应用调用成功，返回正确博物馆推荐信息。

父主题： 观测

上一篇：观测

下一篇：查看应用调用链信息

意见反馈

文档内容是否对您有帮助？

有帮助没帮助

提供反馈

提交成功！非常感谢您的反馈，我们会继续努力做到更好！您可在我的云声建议查看反馈及问题处理状态。

系统繁忙，请稍后重试

在使用文档中是否遇到以下问题

内容与产品页面不一致

内容不易理解

缺失示例代码

步骤不可操作

搜不到想要的内容

缺少最佳实践

意见反馈（选填）

0/500

请至少选择一项反馈信息并填写问题反馈

字符长度不能超过500

直接提交取消

如您有其它疑问，您也可以通过华为云社区问答频道来与我们联系探讨

盘古Doer提问云社区提问