更新时间:2025-12-15 GMT+08:00
默认监控告警
模型在进行训练时,需要重点关注系统资源的使用情况,例如:NPU,CPU,存储。
当前AOM服务可以监控上述系统资源,同时支持设置告警规则,关键指标如表1 指标查看与告警配置建议所示。
父主题: 资源监控、配置告警
检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
模型在进行训练时,需要重点关注系统资源的使用情况,例如:NPU,CPU,存储。
当前AOM服务可以监控上述系统资源,同时支持设置告警规则,关键指标如表1 指标查看与告警配置建议所示。