查看应用指标统计信息
应用指标统计界面提供自动化数据统计功能,实时收集应用的性能指标和资源使用情况。这使运维人员能够快速识别性能瓶颈,从而提升系统的稳定性和可靠性,并实现资源的高效利用和成本优化。
前提条件
- 已开通AgentArts服务。
- 登录用户为空间所有者、空间管理员、运维工程师,详细信息请参考管理团队空间成员。
查看应用指标统计信息
- 登录AgentArts智能体开发平台,在左侧导航栏“个人空间”区域,选择目标空间。
- 在左侧导航栏中选择“运营运维 > 观测”,在“应用指标统计”页签中可以查看智能体和工作流上报的指标信息。

应用指标统计仅统计当前空间下的智能体和工作流应用产生的数据。使用他人共享应用所产生的数据将不会纳入统计范围。
应用指标统计信息说明
应用指标统计界面包含以下信息,如图1所示。
参数 | 说明 | 示例 |
|---|---|---|
使用次数 | 所选应用中上报的Root Span的总数。 | 473次 |
模型调用错误率 | Model Span的状态错误率,即错误状态的Model Span数量占总Model Span数量的比例。 | 0.00% |
Span错误率 | Span的状态错误率,即错误状态的Span数量占总Span数量的比例。 | 1.56% |
模型调用平均耗时 | 模型调用的平均耗时,即Model Span的总耗时除以Model Span的总数量。 | 12.96s |
模型Tokens消耗 | Model Span数据里输入和输出所消耗Tokens的总量。 | 517.67千Tokens |
Tokens消耗 | Tokens消耗分为以下两种类型:
在界面中可以选择以下单位显示Tokens消耗:个Tokens、千Tokens、百万Tokens。 | Input Tokens:369.71千Tokens Output Tokens:147.96千Tokens |
Trace上报量 | 显示上报的Root Span的总数,反映系统中请求的总体规模和趋势。 | 443条 |
模型调用平均耗时 | 显示模型调用的平均耗时,反映模型调用的性能和稳定性。 | 12.96s |
链路整体耗时 | 显示Root Span的耗时,反映整个请求的处理时长。 在界面中可以选择以下单位显示链路整体耗时消耗:Avg、Max、Min、P50、P90、P99。 Avg(Average,平均值):表示一组数据的平均值,即所有数据值相加后除以数据的总数。 Max(Maximum,最大值):表示一组数据中的最大值。 Min(Minimum,最小值):表示一组数据中的最小值。 P50(50thPercentile,第50百分位数,也称为中位数):表示一组数据按从小到大排序后,位于中间位置的数值,有50%的数据小于或等于它,50%的数据大于它的数值。 P90(90thPercentile,第90百分位数):表示一组数据按从小到大排序后,有90%的数据小于或等于它,10%的数据大于它的数值。 P99(99thPercentile,第99百分位数):表示一组数据按从小到大排序后,有99%的数据小于等于它,1%的数据大于等于它的数值。 | 9.12s |
服务请求成功率 | 显示成功状态的Root Span数量占总Root Span数量的占比,反映服务的整体可用性和稳定性。 | 100% |
模型请求成功率 | 大模型调用过程中,成功状态的Model Span数量占总Model Span数量的占比,反映模型调用的成功率和稳定性。 | 100% |
使用过滤器筛选信息
应用指标统计界面支持多维度灵活筛选,帮助运维人员快速定位和分析目标数据。
过滤条件 | 说明 |
|---|---|
数据来源 | 按照数据来源过滤数据。支持以下三种分类:
|
Agent应用 | 支持在选择了数据来源之后,可以在筛选条件下进一步选择不同的应用。 |
时间 | 支持根据上报的时间筛选数据记录。 |


