查看业务指标信息
应用上线运行后,可能会面临Token消耗异常飙升、响应成功率下降或工具调用失败等问题。如果缺乏数据支撑,开发者往往难以定位根因,只能盲目调整提示词或工具配置。
通过“业务指标”页签,您可以监测智能体的关键运行表现,如Token消耗、响应成功率、模型请求成功率、模型调用平均耗时等。通过实时监测这些核心指标,可及时发现性能瓶颈、异常波动或不稳定趋势,全面洞察应用运行质量。
前提条件
- 已开通AgentArts服务。
- 已开启数据上报。数据上报请参考开启数据上报。
约束与限制
仅通过API调用产生的数据才会上报到运营运维。使用API调用智能体,请参考API调用实践。
查看业务指标信息
- 登录AgentArts智能体开发平台。
- 在左侧导航栏中选择“运营运维 > 观测 > 智能体概览”。
- 在“业务指标”页签中,展示所选时间范围内的Token消耗、响应成功率等指标信息。
图1 业务指标统计
业务指标统计信息说明
业务指标统计界面包含以下信息,如表1所示。
|
参数 |
说明 |
示例 |
|---|---|---|
|
Tokens消耗 |
所选时间范围内调用模型消耗的Token总数,包括输入和输出Token数。 |
683 |
|
模型调用次数 |
所选时间范围内应用调用大模型的累计次数。 |
375 |
|
模型调用平均耗时 |
所选时间范围内模型调用的平均耗时。 计算方式:模型调用总耗时除以模型调用的总数量。 |
12.96s |
|
模型调用成功率 |
所选时间范围内,大模型调用成功的次数占总调用次数的比例。 |
12% |
|
会话数 |
所选时间范围内应用产生的会话总数。 |
36471 |
|
用户数 |
所选时间范围内使用当前应用的用户总数(去重)。 |
232 |
|
Tokens消耗 |
所选时间范围内大模型调用过程中,调用模型消耗的Token总数。 Tokens消耗分为以下两种类型:
|
Input Tokens : 369.71 千 Output Tokens: 147.96 千 |
|
QPS/QPM |
所选时间范围内接收到的请求总量。
统计方式:仅统计Root Span。 |
- |
|
响应成功率 |
所选时间范围内服务响应的成功率。 计算方式:在指定时间段内请求成功的数量占请求的总数的比例。 统计方式:指定时间段内发生过实际交互(一问一答)的应用。 |
- |
|
模型调用次数 |
所选时间范围内应用的模型调用次数 |
- |
|
模型调用平均耗时 |
统计所选时间范围内筛选应用的模型调用平均耗时。 计算方式:模型调用总耗时除以模型调用的总数量。 |
12.96s |
|
模型调用成功率 |
所选时间范围内,模型调用成功的次数占总调用次数的比例。 计算方式:成功状态的模型调用数量占总模型调用数量的比例。 |
100% |
使用过滤器筛选信息
支持多维度灵活筛选,帮助运维人员快速定位和分析目标数据。
|
过滤条件 |
说明 |
|---|---|
|
数据来源 |
按照数据来源过滤数据。支持以下三种分类:
|
|
Agent应用 |
在选定数据来源后,进一步筛选特定的应用。 |
|
时间 |
支持根据时间筛选数据记录。
说明:
选择“自定义时间”时,仅支持查询最近90天内的数据。 |
常见问题
为什么界面显示“暂无数据”?
- 检查时间范围:确认时间筛选器中选择的时间范围内,是否与智能体进行过交互。
- 检查数据来源:确认是否选择了正确的“数据来源”或具体的“应用名称”。
统计数据有延迟吗?
数据统计通常存在约1分钟的延迟。如果您刚执行完操作,建议等待1分钟后刷新页面查看。