指标统计
指标统计界面提供自动化数据统计功能,实时收集应用的性能指标和资源使用情况。这使运维人员能够快速识别性能瓶颈,从而提升系统的稳定性和可靠性,并实现资源的高效利用和成本优化。
查看调用链指标统计信息
- 登录Versatile智能体平台,在左侧导航栏“个人空间”区域,选择进入所需空间。
如果已选择团队空间,界面显示为实际的团队空间名称,而非“个人空间”。
图1 选择团队空间 - 在左侧导航栏中选择“ 运营运维 > 指标统计”。
图2 指标统计
指标统计信息说明
指标统计界面包含以下信息,如表1所示。
参数 |
说明 |
示例 |
---|---|---|
使用次数 |
所选应用中上报的Root Span的总数。 |
441次 |
模型调用错误率 |
Model Span的状态错误率,即错误状态的Model Span数量占总Model Span数量的比例。 |
31.39% |
Span错误率 |
Span的状态错误率,即错误状态的Span数量占总Span数量的比例。 |
25.58% |
模型调用平均耗时 |
模型调用的平均耗时,即Model Span的总耗时除以Model Span的总数量。 |
4594ms |
模型Tokens消耗 |
Model Span数据里输入和输出所消耗Tokens的总量。 |
4.00千Tokens |
Tokens消耗 |
Tokens消耗分为以下两种类型:
在界面中可以选择以下单位显示Tokens消耗:个Tokens、千Tokens、百万Tokens。 |
Input Tokens:1.6千Tokens Output Tokens:2.4千Tokens |
Trace上报量 |
以折线图的方式显示上报的Root Span的总数,反映系统中请求的总体规模和趋势。 |
441条 |
模型调用平均耗时 |
以折线图的方式显示模型调用的平均耗时,反映模型调用的性能和稳定性。 |
2397ms |
链路整体耗时 |
以折线图的方式显示调用链路从开始到结束所耗费的总时间,反映整个请求的处理时长。 在界面中可以选择以下单位显示链路整体耗时消耗:Avg、Max、Min、P50、P90、P99。 |
9.12s |
服务请求成功率 |
以折线图的方式显示成功状态的Root Span数量占总Root Span数量的占比,反映服务的整体可用性和稳定性。 |
100% |
模型请求成功率 |
以折线图的方式显示成功状态的Model Span数量占总Model Span数量的占比,反映模型调用的成功率和稳定性。 |
100% |
使用过滤器筛选信息
指标统计界面支持多维度灵活筛选,帮助运维人员快速定位和分析目标数据。
过滤条件 |
说明 |
---|---|
数据来源 |
支持按照数据来源支持以下三种分类:
|
Agent应用 |
支持在选择了数据来源之后,可以在筛选条件下进一步选择不同的应用。 |
时间 |
支持根据上报的时间筛选数据记录。 |