文档首页 > > AI工程师用户指南> 监控> ModelArts支持的监控指标

ModelArts支持的监控指标

分享
更新时间:2020/07/14 GMT+08:00

功能说明

为使用户更好地掌握自己的ModelArts在线服务和对应模型负载的运行状态,云服务平台提供了云监控。您可以使用该服务监控您的ModelArts在线服务和对应模型负载,执行自动实时监控、告警和通知操作,帮助您更好地了解服务和模型的各项性能指标。

命名空间

SYS.ModelArts

监控指标

表1 ModelArts支持的监控指标

指标ID

指标名称

含义

取值范围

测量对象&维度

监控周期

cpu_usage

CPU使用率

该指标用于统计ModelArts用户服务的CPU使用率。

单位:百分比。

≥ 0%

测量对象:

ModelArts模型负载

测量维度:

model_id

1分钟

mem_usage

内存使用率

该指标用于统计ModelArts用户服务的内存使用率。

单位:百分比。

≥ 0%

测量对象:

ModelArts模型负载

测量维度:

model_id

1分钟

gpu_util

GPU使用率

该指标用于统计ModelArts用户服务的GPU使用情况。

单位:百分比。

≥ 0%

测量对象:

ModelArts模型负载

测量维度:

model_id

1分钟

gpu_mem_usage

GPU显存使用率

该指标用于统计ModelArts用户服务的GPU显存使用情况。

单位:百分比。

≥ 0%

测量对象:

ModelArts模型负载

测量维度:

model_id

1分钟

successfully_called_times

调用成功次数

统计ModelArts用户调用服务的成功次数。

单位:次/分钟。

≥Count/min

测量对象:

ModelArts模型负载

ModelArts在线服务

测量维度:

model_id,

service_id

1分钟

failed_called_times

调用失败次数

统计ModelArts用户调用服务的失败次数。

单位:次/分钟。

≥Count/min

测量对象:

ModelArts模型负载

ModelArts在线服务

测量维度:

model_id,

service_id

1分钟

total_called_times

调用次数

统计ModelArts用户调用服务的次数。

单位:次/分钟。

≥Count/min

测量对象:

ModelArts模型负载

ModelArts在线服务

测量维度:

model_id,

service_id

1分钟

对于有多个测量维度的测量对象,使用接口查询监控指标时,所有测量维度均为必选。

  • 查询单个监控指标时,多维度dim使用样例:dim.0=service_id,530cd6b0-86d7-4818-837f-935f6a27414d&dim.1="model_id,3773b058-5b4f-4366-9035-9bbd9964714a。
  • 批量查询监控指标时,多维度dim使用样例:

    "dimensions": [

    {

    "name": "service_id",

    "value": "530cd6b0-86d7-4818-837f-935f6a27414d"

    }

    {

    "name": "model_id",

    "value": "3773b058-5b4f-4366-9035-9bbd9964714a"

    }

    ],

维度

表2 维度说明

Key

Value

service_id

在线服务ID。

model_id

模型负载ID。

分享:

    相关文档

    相关产品

文档是否有解决您的问题?

提交成功!

非常感谢您的反馈,我们会继续努力做到更好!

反馈提交失败,请稍后再试!

*必选

请至少选择或填写一项反馈信息

字符长度不能超过200

提交反馈 取消

如您有其它疑问,您也可以通过华为云社区问答频道来与我们联系探讨

智能客服提问云社区提问