查看业务指标信息

应用上线运行后，可能会面临Tokens消耗异常飙升、响应成功率下降或模型调用耗时突增等问题。如果缺乏数据支撑，开发者往往难以定位根因，只能盲目调整提示词或工具配置。

通过“业务指标”页签，您可以监测智能体的关键运行表现，如Tokens消耗、响应成功率、模型请求成功率、模型调用平均耗时等。通过实时监测这些核心指标，可及时发现性能瓶颈、异常波动或不稳定趋势，全面洞察应用运行质量。

前提条件

已开通AgentArts服务。
已开启数据上报。数据上报请参考开启数据上报。

约束与限制

仅通过API调用产生的数据才会上报到运营运维模块。控制台调试和编排预览不计入统计。使用API调用智能体，请参考API调用实践。

费用说明

展示数据不收取任何费用，但与智能体交互或数据上报至其他服务会产生相应的管理费用。具体计费场景如下：

智能体交互：查看指标本身不产生费用。与智能体交互调试时将消耗Token，具体计费规则请参见计费说明。
指标上报：该功能依赖应用运维管理（AOM）服务，按上报数据量计费，费用明细请参考AOM计费说明。

查看业务指标信息

登录AgentArts智能体平台。
在左侧导航栏中选择“运营运维 > 观测 > 智能体概览”。
在“业务指标”页签中，展示所选时间范围内的Tokens消耗、响应成功率等指标信息。
- 查看指标：在页面上方选择目标智能体和时间范围，查看对应的业务指标数据。
- 配置自动刷新：如果需要自动刷新页面数据，请单击页面右上角的“自动刷新关闭”下拉列表，选择数据刷新的时间间隔。
如果页面未显示数据，请参见常见问题进行排查。
图1 业务指标统计

业务指标统计信息说明

业务指标统计界面包含以下信息，如表1所示。

表1 业务指标统计参数说明
参数	说明	示例
Tokens消耗	所选时间范围内大模型调用过程中，调用模型消耗的Token总数。 Tokens消耗分为以下两种类型： Input Tokens消耗：大模型调用过程中，输入数据所消耗的Tokens数量。 Output Tokens消耗：大模型调用过程中，输出数据所消耗的Tokens数量。	1183Tokens
模型调用次数	所选时间范围内应用调用大模型的累计次数。	2.05次
模型调用平均耗时	所选时间范围内模型调用的平均耗时。计算方式：模型调用总耗时除以模型调用的总数量。	1.58万毫秒
模型调用成功率	所选时间范围内，大模型调用成功的次数占总调用次数的比例。	100%
会话数	所选时间范围内应用产生的会话总数。	3个
用户数	所选时间范围内使用当前应用的用户总数（去重）。	1个
QPS/QPM	所选时间范围内接收到的请求总量。 QPS：每秒请求数，分为成功QPS和失败QPS。 QPM：每分钟请求数，分为成功QPM和失败QPM。统计方式：仅统计Root Span（即从用户发起提问，到智能体给出最终回答的端到端完整生命周期）。	-
响应成功率	所选时间范围内服务响应的成功率。计算方式：在指定时间段内请求成功的数量占请求的总数的比例。	-
模型消耗排行（Top5）	展示指定时间段内，所选智能体中Token消耗量排名前5的大模型。	-
模型调用排行（Top5）	展示指定时间段内，所选智能体中调用次数排名前5的大模型。	-
模型调用平均耗时排行（Top5）	展示指定时间段内，所选智能体中平均调用耗时排名前5的大模型。	-

使用过滤器筛选信息

支持多维度灵活筛选，帮助运维人员快速定位和分析目标数据。

表2 过滤维度
过滤条件	说明
数据来源	按照数据来源过滤数据。支持以下三种分类：单智能体应用：单智能体应用的统计数据。工作流应用：工作流应用的统计数据。多智能体应用：多智能体应用的统计数据。
Agent应用	在选定数据来源后，进一步筛选特定的应用。
时间	支持根据时间筛选数据记录。说明：选择“自定义时间”时，仅支持查询最近30天内的数据。