查看业务指标信息
应用上线运行后,可能会面临Tokens消耗异常飙升、响应成功率下降或模型调用耗时突增等问题。如果缺乏数据支撑,开发者往往难以定位根因,只能盲目调整提示词或工具配置。
通过“业务指标”页签,您可以监测智能体的关键运行表现,如Tokens消耗、响应成功率、模型请求成功率、模型调用平均耗时等。通过实时监测这些核心指标,可及时发现性能瓶颈、异常波动或不稳定趋势,全面洞察应用运行质量。
前提条件
- 已开通AgentArts服务。
- 已开启数据上报。数据上报请参考开启数据上报。
约束与限制
仅通过API调用产生的数据才会上报到运营运维。使用API调用智能体,请参考API调用实践。
费用说明
展示数据不收取任何费用,但与智能体交互或数据上报至其他服务会产生相应的管理费用。具体计费场景如下:
查看业务指标信息
- 登录AgentArts智能体开发平台。
- 在左侧导航栏中选择“运营运维 > 观测 > 智能体概览”。
- 在“业务指标”页签中,展示所选时间范围内的Tokens消耗、响应成功率等指标信息。如果页面未显示数据,请参见常见问题进行排查。 图1 业务指标统计
业务指标统计信息说明
业务指标统计界面包含以下信息,如表1所示。
| 参数 | 说明 | 示例 |
|---|---|---|
| 会话数 | 所选时间范围内应用产生的会话总数。 | 36471 |
| 用户数 | 所选时间范围内使用当前应用的用户总数(去重)。 | 232 |
| Tokens消耗 | 所选时间范围内大模型调用过程中,调用模型消耗的Token总数。 Tokens消耗分为以下两种类型:
| Input Tokens : 369.71 千 Output Tokens: 147.96 千 |
| QPS/QPM | 所选时间范围内接收到的请求总量。
统计方式:仅统计Root Span(即从用户发起提问,到智能体给出最终回答的端到端完整生命周期)。 | - |
| 响应成功率 | 所选时间范围内服务响应的成功率。 计算方式:在指定时间段内请求成功的数量占请求的总数的比例。 | - |
| 模型调用次数 | 所选时间范围内应用调用大模型的累计次数。 | - |
| 模型调用平均耗时 | 统计所选时间范围内筛选应用的模型调用平均耗时。 计算方式:模型调用总耗时除以模型调用的总数量。 | 12.96s |
| 模型调用成功率 | 所选时间范围内,模型调用成功的次数占总调用次数的比例。 计算方式:成功状态的模型调用数量占总模型调用数量的比例。 | 100% |
使用过滤器筛选信息
支持多维度灵活筛选,帮助运维人员快速定位和分析目标数据。
| 过滤条件 | 说明 |
|---|---|
| 数据来源 | 按照数据来源过滤数据。支持以下三种分类:
|
| Agent应用 | 在选定数据来源后,进一步筛选特定的应用。 |
| 时间 | 支持根据时间筛选数据记录。 说明: 选择“自定义时间”时,仅支持查询最近90天内的数据。 |