更新时间:2026-04-16 GMT+08:00
分享

查看业务指标信息

应用上线运行后,可能会面临Token消耗异常飙升、响应成功率下降或工具调用失败等问题。如果缺乏数据支撑,开发者往往难以定位根因,只能盲目调整提示词或工具配置。

通过“业务指标”页签,您可以监测智能体的关键运行表现,如Token消耗、响应成功率、模型请求成功率、模型调用平均耗时等。通过实时监测这些核心指标,可及时发现性能瓶颈、异常波动或不稳定趋势,全面洞察应用运行质量。

前提条件

约束与限制

仅通过API调用产生的数据才会上报到运营运维。使用API调用智能体,请参考API调用实践

查看业务指标信息

  1. 登录AgentArts智能体开发平台
  2. 在左侧导航栏中选择“运营运维 > 观测 > 智能体概览”。
  3. 在“业务指标”页签中,展示所选时间范围内的Token消耗、响应成功率等指标信息。

    图1 业务指标统计

业务指标统计信息说明

业务指标统计界面包含以下信息,如表1所示。

表1 业务指标统计参数说明

参数

说明

示例

Tokens消耗

所选时间范围内调用模型消耗的Token总数,包括输入和输出Token数。

683

模型调用次数

所选时间范围内应用调用大模型的累计次数。

375

模型调用平均耗时

所选时间范围内模型调用的平均耗时。

计算方式:模型调用总耗时除以模型调用的总数量。

12.96s

模型调用成功率

所选时间范围内,大模型调用成功的次数占总调用次数的比例。

12%

会话数

所选时间范围内应用产生的会话总数。

36471

用户数

所选时间范围内使用当前应用的用户总数(去重)。

232

Tokens消耗

所选时间范围内大模型调用过程中,调用模型消耗的Token总数。

Tokens消耗分为以下两种类型:

  • Input Tokens消耗:大模型调用过程中,输入数据所消耗的Tokens数量。
  • Output Tokens消耗:大模型调用过程中,输出数据所消耗的Tokens数量。

Input Tokens : 369.71 千

Output Tokens: 147.96 千

QPS/QPM

所选时间范围内接收到的请求总量。

  • QPS:每秒请求数,分为成功QPS和失败QPS。
  • QPM:每分钟请求数,分为成功QPM和失败QPM。

统计方式:仅统计Root Span。

-

响应成功率

所选时间范围内服务响应的成功率。

计算方式:在指定时间段内请求成功的数量占请求的总数的比例。

统计方式:指定时间段内发生过实际交互(一问一答)的应用。

-

模型调用次数

所选时间范围内应用的模型调用次数

-

模型调用平均耗时

统计所选时间范围内筛选应用的模型调用平均耗时。

计算方式:模型调用总耗时除以模型调用的总数量。

12.96s

模型调用成功率

所选时间范围内,模型调用成功的次数占总调用次数的比例。

计算方式:成功状态的模型调用数量占总模型调用数量的比例。

100%

使用过滤器筛选信息

支持多维度灵活筛选,帮助运维人员快速定位和分析目标数据。

表2 过滤维度

过滤条件

说明

数据来源

按照数据来源过滤数据。支持以下三种分类:

  • 单智能体应用:单智能体应用的统计数据。
  • 工作流应用:工作流应用的统计数据。
  • 多智能体应用:多智能体应用的统计数据。

Agent应用

在选定数据来源后,进一步筛选特定的应用。

时间

支持根据时间筛选数据记录。

说明:

选择“自定义时间”时,仅支持查询最近90天内的数据。

常见问题

为什么界面显示“暂无数据”?

  • 检查时间范围:确认时间筛选器中选择的时间范围内,是否与智能体进行过交互。
  • 检查数据来源:确认是否选择了正确的“数据来源”或具体的“应用名称”。

统计数据有延迟吗?

数据统计通常存在约1分钟的延迟。如果您刚执行完操作,建议等待1分钟后刷新页面查看。

相关文档